金融行业标准网
ICS 35.240 CCS L 78 YD 中华人民共和国通信行业标准 YD/T XXXX-XXXX 高性能计算(HPC)云平台能力要求 The capability requirements of high performance computing cloud platform (报批稿) XXXX - XX - XX 发布 XXXX- XX- XX 实施 中华人民共和国工业和信息化部发布 XXXX-XXXXX 1/XX 前言 本文件按照GB/T1.1一2020《标准化工作导则第1部分:标准化文件的结构和起草规则》的规定 起草。 请注意本文件的某些内容可能涉及专利。本文件的发布机构不承担识别这些专利的责任 本文件由中国通信标准化协会提出并归口。 本文件起草单位:中国信息通信研究院、中国科学院计算技术研究所、华为技术有限公司、阿里云 计算有限公司、深圳市腾讯计算机系统有限公司、中移(苏州)软件技术有限公司、中国移动通信集团有 限公司、中移互联网有限公司、上海云轴信息科技有限公司、北京字节跳动科技有限公司、深圳华大生 命科学研究院、优刻得科技股份有限公司、英特尔(中国有限公司、杭州谐云科技有限公司 本文件主要起草人:郑立、王海清、景鹏、韩思齐、马龙飞、栗蔚、陈屹力、唐宏伟、高巍、吴雷、 杨广贺、魏欢、杨晓峰、向伟、陈鹏、王昊、李斌、张波、蔡国瑜、黄河清、王海宁、王庆、冯晓焰、 娄涛、朱文鹏、何纯钢、李娜、谢洪涛、蔡旭辉、杨光达、陈、孙文庆、王峻、朱林 II XXXX-XXXXX 1/XX 高性能计算(HPC)云平台能力要求 1范围 本文件规范了高性能计算(HPC)云平台的能力要求,覆盖基础资源能力要求、平台能力要求、应 用能力要求、运维管理及安全能力要求、平台性能要求。 本文件对高性能计算(HPC)云平台及相关工具能力进行分级,分为基础级、增强级和先进级, 本文件同时适用于云服务、软件产品和工具,即面向公共用户提供公有云服务和混合云环境下的解 决方案或工具。依据交付形式的差异,本文件针对不同的使用场景其技术指标要求略有不同。 2规范性引用文件 下列文件中的内容通过文中的规范性引用而构成本文件必不可少的条款。其中,注日期的引用文件, 仅该日期对应的版本适用于本文件:不注日期的引用文件,其最新版本(包括所有的修改单)适用于本 文件。 YD/T1133-2001数据通信名词术语 3术语和定义 下列术语和定义适用于本文件。 3. 1 高性能计算highperformancecomputing 利用超级计算机实现并行计算的理论、方法、技术以及应用的一门技术科学,围绕利用不断发展的 并行处理单元以及并行体系架构实现高性能并行计算这一核心问题,该领域研究范围包括并行计算模型 并行编程模型、并行执行模型、并行自适应框架、并行体系结构、并行网络通信以及并行算法设计等。 3. 2 高性能计算云平台highperformancecomputingcloudplatform 套基于云计算模式提供高性能计算服务的系统,它采用虚拟化、容器等技术对计算、存储、网络 等基础资源进行池化,整合HPC作业管理调度、集群管理等平台软件,基于资源与服务编排、自动化部 署等技术,向用户提供弹性、可扩展、自助化的HPC算力、平台以及应用服务。 4缩略语 下列缩略语适用于本文件: 1 XX/T XXXXX-XXXX API:应用编程接口(ApplicationProgrammingInterface) CPU:中央处理器(CentralProcessingUnit) CUDA:通用并行计算架构(ComputeUnifiedDeviceArchitecture) DHCP:动态主机配置协议(DynamicHostConfigurationProtocol) DNS:域名服务器(DomainNameServer) FPGA:现场可编程阵列(FieldProgrammableGateArray) GPU:图形处理单元(GraphicsProcessingUnit) HPC:高性能计算(HighPerformanceComputing) IB:无限带宽计算机网络通信标准(InfiniBand) IDE:集成开发环境(IntegratedDevelopmentEnvironment) LDAP:轻量目录访问协议(LightweightDirectoryAccessProtocol) MPI:消息传递接口(MessagePassingInterface) NAS:网络附加存储(NetworkAttachedStorage) NoF:不同种类网络中传输存储协议的技术路线总称(NVMeoverFabric) NPU:神经网络处理器(NeuralProcessingUnit) PVM:并行虚拟机(ParallelVirtualMachine) RoCE:基于融合以太网的集群网络通信协议(RDMAoverConvergedEthernet) SAN:存储区域网络(StorageAreaNetwork) SDN:软件定义网络(SoftwareDefinedNetwork,SDN) 高性能计算云平台能力框架 5 运维管理及 应 平台性能 安全能力 用 应用软件 可视化 用户接口 能 力 用户管理 用户鉴别 数据管理 综合性能 数据存储 数据迁移 数据迁移 数据备份/恢复 用户组 权限控制 平 作业调度 集群管理 台 作业管理 作业弹性伸缩 能 集群管理 节点管理 计费计量 力 作业并行调度 作业工作流编排 运行环境 单项性能 监控告警 运行时软件栈 编程接口 基础资 日志审计 网络资源 计算资源 存储资源 源 2 xXxX-xxXxx 1/xX 图1高性能计算(HPC)云平台能力框架图 高性能计算云平台能力框架包括基础资源能力、平台能力、应用能力,同时包含运维管理及安全能 力、平台性能,如图1所示。 6高性能计算云平台能力分级 6.1分级概述 高性能计算云平台能力分级划分为基础级、增强级和先进级。各级别对应的具体能力要求见第7-11 章。各级别服务能力描述如下: a)基础级(1级能力):HPC云平台基本能力要求; b)增强级(2级能力):在基础级能力的基础上,具备较高级的功能实现,平台更易用; c)先进级(3级能力):在增强级能力的基础上,作为HPC云平台的能力引导项。 6.2分级规则 高性能计算(HPC)云平台能力分为三级。部分模块有1级、2级、3级的能力要求项,每级满足90% 的能力项即可认为达到该级别要求。根据各模块的通过级别分为基础级、增强级和先进级。 7基础资源能力要求 7.1基础资源能力要求概述 HPC云平台需要有计算、存储和网络资源的支持, 7.2计算资源 描述:指平台能提供给用户的计算资源类型、规格要求、虚拟化方法、管理手段等。 1级能力要求如下: a)应支持基于通用处理器的服务器,如X86架构处理器、ARM架构处理器等; b)应支持异构计算资源,如CPU、GPU、FPGA、NPU等; c)应支持裸金属服务器作为计算资源; d)应支持云主机状态查询和生命周期管理: e)应支持云主机快照创建、查询和管理: f)应支持使用快照恢复虚拟机到正常状态; g)应支持远程访问云主机控制台: h)应支持多租户间计算资源隔离,包括计算、存储、网络资源隔离和数据隔离; i)应支持通过多种镜像格式和用户自制镜像进行操作系统快速部署; j)应支持计算资源穴余和故障切换; k)应支持计算资源的负载均衡; 1)应支持计算集群资源的弹性伸缩; m)应支持计算资源的容器化部署。 2级能力要求如下: a)应支持跨集群迁移计算资源 3 XXXX-XXXXX 1/XX b)应支持在不同类型存储介质之间迁移虚拟机: )应支持云主机批量操作,包括:创建、迁移、启动、关闭、重启等操作 d)应支持虚拟机回收站功能; e)应支持重装虚拟机操作系统; f)应支持热添加云主机CPU、内存、网络、磁盘等虚拟硬件; g)应支持NUMA状态的查询和配置; h)应支持自定义云主机故障恢复的优先级; i)应支持为云主机配置物理CPU核心绑定。 3级能力要求如下: a)应支持在同一集群中对不同架构计算资源的统一管理,如CPU、GPU、FPGA、NPU等; b)宜支持GPU计算资源多容器共享; c)宜支持安全容器,如KATA等; d)宜支持容器资源生命周期管理,包括启动、释放、健康检查等; e)平台宜支持弹性计算资源,即能够根据用户需求动态调整计算资源的数量和规格,以满足不同 场景下的计算需求; f)平台宜支持自动化管理功能,包括自动化部署、自动化监控、自动化扩缩容等,以提高平台的 管理效率和稳定性。 7. 3 网络资源 描述:指平台能够提供给用户的网络资源类型、规格要求、安全设置、管理手段等 1级能力要求如下: a)应支持低时延无损网络,如IB、RoCE、NoF等 b)应支持虚拟网络的管理,如创建、删除、编辑、查询等; c)应支持虚拟机虚拟网卡IP地址管理,如自动分配,手动指定,回收等; d)应支持对虚拟子网、网关或者路由规则的创建、删除、编辑、查询; e)应支持多种类型的网络,如IPv4和IPv6虚拟子网的创建和管理; f)应支持实现大二层虚拟网络,如基于VLAN和VxLAN协议: g)应支持虚拟机运行过程中对虚拟网卡动态配置; h)应支持虚拟机网卡安全组设置。 2级能力要求如下: a)应支持虚拟网卡多队列设置, b)应支持多个以太网物理网卡配置链路聚合; c)应支持在图形化界面直观查看虚拟网络的网络拓扑: d)应支持创建、修改和分配多个弹性IP; e)应支

.pdf文档 YD-T 6484-2025 高性能计算 HPC 云平台能力要求

文档预览
中文文档 20 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共20页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
YD-T 6484-2025 高性能计算 HPC 云平台能力要求 第 1 页 YD-T 6484-2025 高性能计算 HPC 云平台能力要求 第 2 页 YD-T 6484-2025 高性能计算 HPC 云平台能力要求 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2026-01-25 04:23:50上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。