金融行业标准网
ICS 35. 240 CCS L67 YD 中华人民共和国通信行业标准 YD/TXXXX-202X 面向人工智能的数据生产和标注服务能 力通用成熟度模型 model for artificial intelligence 2024-xX-XX发布 2024-XX-XX实施 中华人民共和国工业和信息化部 发布 YD/T XXXX-XXXX 言 前 本文件按照GB/T1.1一2020《标准化工作导则第1部分:标准化文件的结构和起草规则》的规定 起草。 请注意本文件的某些内容可能涉及专利。本文件的发布机构不承担识别专利的责任。 本文件由中国通信标准化协会提出并归口。 本文件起草单位:中国信息通信研究院、中电数据产业集团有限公司、北京海天瑞声科技股份有限 公司、砺英数智(北京)数据技术有限公司、软通动力信息技术(集团)股份有限公司、中国民航信息网 络股份有限公司、北京希尔贝壳科技有限公司、北京云测信息技术有限公司、中国联合网络通信有限公 司软件研究院、北京百度网讯科技有限公司。 本文件主要起草人:燕江依、樊威、李荪、曹峰、赵丹萍、韩旭、张媛媛、唐甜甜、陆志鹏、韩光、 郑曦、丁浩、崔向雨、蒲逸凡、李哲洙、李洪金、庞超、钟万里、李怡如、李劲松、郭卫泳、卜辉、徐 昕、贾宇航、房建伟,苏光耀,周涛、沈健、潘越。 II YD/T XXXX-XXXX 面向人工智能的数据生产和标注服务能力通用成熟度模型 1范围 本文件规定了面向人工智能的数据生产标注服务能力要求,主要包括技术服务、标准规范、人员管 理、项目管理、运营维护、生态培育、安全保障等要求。 本文件适用于人工智能数据供应方数据生产标注服务能力的评价与指导,也可作为人工智能数据需 求方衡量供应方数据生产标注服务能力水平的标准依据。 规范性引用文件 下列文件中的内容通过文中的规范性引用而构成本文件必不可少的条款。其中,注日期的引用文件, 仅该日期对应的版本适用于本文件;不注日期的引用文件,其最新版本(包括所有的修改单)适用于本 文件。 GB/T36073-2018数据管理能力成熟度评估模型 GB/T41867-2022信息技术人工智能术语 3术语和定义 3. 1 人工智能数据集artificialintelligencedataset 用于训练和测试人工智能模型的大量数据集合,其中包含多种类型的数据。这些数据集通常由 专业的数据采集团队或机构收集并标注,以提供给算法工程师和研究人员使用。 3. 2 数据标注datadeliveryservice 对未经处理的语音、图片、文本、视频等不同模态数据进行加工处理,并转换为机器可识别信 息的过程。 3. 3 数据安全datasecurity 数据的机密性、完整性和可用性。 [来源:GB/T36073-2018,定义3.11] 3. 4 1 YD/T XXXX-XXXX 机器学习模型machinelearningmodel 一种基于输入数据或信息生成推理或预测的计算结构 [来源:GB/T41867-2022,定义3.2.11] 缩略语 下列缩略语适用于本文件。 AES 高级加密标准 AdvancedEncryptionStandard AI 人工智能 Artificial Intelligence API 应用程序编程接口 Application Programming Interface FTP 文件传输协议 File Transfer Protocol 数据生产标注服务能力框架 5 数据生产标注服务主要指对人工智能数据集和相关服务进行交付和实施的过程,主要包括技术服务 标准规范、人员管理、项目管理、运营维护、生态培育、安全保障等七大方面,数据生产标注服务能力 成熟度模型由成熟度评估等级和能力域构成,其中能力域由能力项构成,如表1所示。成熟度评估等级 如表2所示。 表1数据生产标注服务通用成熟度模型能力组成 能力域 能力要素 数据采集 数据处理 技术服务 数据标注 数据质检 数据合成 体系建设 标准规范 应用推广 人员培训 人员管理 人员考核 人才激励 进度管理 成本管理 项目管理 资源管理 生态协同 运营维护 服务模式 2 YD/T XXXX-XXXX 运维服务 场景应用 业务培育 生态培育 资源管理 生态协同 安全管理 安全保障 防护技术 监测预警 表2成熟度评估等级 等级 等级说明 技术服务:具备基本的数据处理和标注工具,能够支持简单的数据标注任务。 标准规范:遵循基本的数据标注标准,但标准化程度不高。 人员管理:提供基本的标注技能培训,人才储备有限。 项目管理:理解数据标注项目的基本概念和流程,能够管理小型项目。 1级 能够使用基本的项目管理工具跟踪进度。 运营维护:能够完成基本的交付任务,但服务效率和质量有待提高。 生态培育:提供基础的数据标注服务,对行业生态了解有限。 安全保障:具备基本的数据保护措施,但安全体系不完善。 技术服务:拥有较为先进的数据处理和标注技术平台,能够支持较复杂的数据标 注任务。 标准规范:较为严格地遵循数据标注标准,标准化程度较高。 人员管理:建立完善的标注技能培训体系,具备一定的人才储备。 2级 项目管理:能够独立管理中等规模的项目,并使用项目管理软件进行任务分配、 进度跟踪和资源协调。 运营维护:服务效率和质量得到显著提升,能够满足客户的基本需求。 生态培育:对行业生态有较深入的了解,能够提供定制化的数据标注服务。 安全保障:建立完善的数据安全保护体系,确保数据的安全性和隐私性。 技术服务:拥有功能全面的数据标注工具,支持主流数据类型的标注,初步引入 自动化辅助功能。 标准规范:遵循行业普遍认可的数据标注标准,有标准化的工作流程。 人员管理:有基础的培训机制,确保团队成员达到行业平均水平。 3级 项目管理:能够管理大型数据标注项目,涉及复杂的数据集和多团队协作。 运营维护:保证项目按时完成,有基本的项目管理和质量控制流程。 生态培育:服务于多个行业,提供标准化的标注服务,逐步积累行业经验。 安全保障:遵循基本的数据安全规范,有数据加密和访问控制措施,可能拥有部 分安全认证。 技术服务:具备成熟的智能化标注工具,支持多模态数据标注,自动化辅助工具 4级 大幅提高标注效率,实现数据质量与效率的平衡。 3 YD/T XXXX-XXXX 标准讨论与修订。 人员管理:建立系统性的培训计划,定期对员工进行技能升级,与教育机构合作, 促进专业人才的培养与引进。 项目管理:拥有丰富的数据标注项目管理经验,能够处理高复杂度和大规模的项 目。 运营维护:提供快速响应的客户服务,有明确的服务等级协议(SLA),确保项目 按时按质交付。 生态培育:在多个行业有成功案例,能够提供行业特定的标注解决方案,与行业 伙伴建立紧密合作关系。 安全保障:实施严格的数据安全管理,通过ISO等信息安全认证,定期进行安全 审计,确保数据安全和隐私保护。 技术服务:采用最前沿的人工智能和自动化标注技术,结合深度学习算法自动生 成标注建议,实现高度自动化和智能化的标注流程,支持大规模并发处理各类复 杂数据。 标准规范:全面遵循并参与制定国际国内数据标注标准,实现标准化作业流程, 拥有ISO等多重国际认证,确保服务全球合规。 人员管理:拥有完善的内部人才培养体系,对外提供行业认证培训,与高校合作 建立数据科学相关专业,为行业持续输送高端人才。 5级 项目管理:具有深厚的专业知识和实践经验,能够设计和实施创新的项目管理方 法,能为组织制定项目管理战略方向。 运营维护:提供端到端定制化服务,承诺并实现极短的交付周期,配备高级项目 经理,实现高效沟通和无缝对接,客户满意度极高。 生态培育:引领行业标准制定,与头部企业深度合作,定制化解决方案广泛应用 于多个垂直领域,推动数据标注服务的行业生态发展。 安全保障:实施最严格的数据保护措施,拥有顶级安全认证,包括但不限于 IS027001、GDPR合规等,配备高级安全团队和尖端技术防范数据泄露。 数据生产标注服务能力要求 6 6.1技术服务 6.1.1 数据采集 数据采集是指通过各种技术手段和工具收集、获取和提取大规模数据的过程,这些数据可以来自多 种来源,如公开的数据集、公司内部的数据库、用户生成的数据、传感器数据等,数据的类型可以多样, 包括图像、文本、声音、视频等 应具备以下能力: 数据源获取:能够抓取和收集来自不同数据源的数据,比如各类网站数据、社交媒体平台数据、 搜索引擎数据、开源共享平台数据、政府公开数据、企业公开数据等; 4 YD/T XXXX-XXXX 一一数据采集工具:支持使用多种不同类型的数据采集工具,比如网页爬虫、API工具、文档和文 件抓取器、数据库管理工具、数据流处理工具等; 一一多模态数据采集:具备采集和处理大模型多模态数据(文本、图像、语音、视频等)的能力。 一一实时数据处理:可快速响应数据源的变化,实时采集、处理和分析数据,并将结果反馈给应用 程序或用户; 一一异常检测与处理:能够及时发现并处理数据采集过程中出现的异常情况,确保数据的可靠性和 稳定性; 一一数据存储与管理:支持将数据存储到适当的数据存储系统(如数据库、文件系统等)中,并进 行有效的数据管理,包括数据的备份、恢复和清理等; 一数据安全与隐私保护:支持对数据进行加密、脱敏和访问控制等操作,确保数据的安全性和隐 私不被侵犯; 一一任务调度与自动化:根据预设的计划或规则可以自动启动数据采集任务,并合理地调度和管理 任务的执行; 一一大规模数据处理:具备高效处理大规模数据的能力,包括数据的压缩、存储和传输等; 一一跨平台与跨网络采集:支持跨平台和跨网络方式

.pdf文档 YD-T 6487-2025 面向人工智能的数据生产和标注服务能力通用成熟度模型

文档预览
中文文档 24 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共24页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
YD-T 6487-2025 面向人工智能的数据生产和标注服务能力通用成熟度模型 第 1 页 YD-T 6487-2025 面向人工智能的数据生产和标注服务能力通用成熟度模型 第 2 页 YD-T 6487-2025 面向人工智能的数据生产和标注服务能力通用成熟度模型 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2026-01-25 04:26:04上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。