金融行业标准网
ICS 33.050.01 CS M30 YD 中华人民共和国通信行业标准 YD/T XXXX-XXXX 智能语音助手服务接入指南 Guide for intelligent voice assistant service access (报批稿) XXXX- XX- XX 实施 XXXX-XX-XX 发布 发 中华人民共和I 息化部 YD/T XXXX-XXXX 目录 前 言 1范围. 2规范性引用文件.. 3术语和定义 4缩略语... 5语音助手接入参考框架和接入流程 5.1接入参考框架. 5.2接入流程. 5.3开启对话. 附录A (资料性)参考协议 A.1三方平台访问请求 A.2智能终端语音控制流程 YD/T XXXX-XXXX 前言 本文件按照GB/T1.1-2020《标准化工作导则第1部分:标准化文件的结构和起草规则》的规定起 草。 请注意本文件的某些内容可能涉及专利。本文件的发布机构不承担识别专利的责任。 本文件由中国通信标准化协会提出并归口。 本文件起草单位:中国信息通信研究院、中国移动通信集团有限公司、维沃移动通信有限公司、广 东欧珀移动通信有限公司、北京百度网讯科技有限公司、高通无线通信技术(中国)有限公司、中兴通讯 股份有限公司、青岛海信通信有限公司、联想移动通信科技有限公司。 本文件主要起草人:傅蓉蓉、杨一帆、董千洲、张学杰、王晓林、高立发、罗红、刘毓炜。 1I YD/T XXXX-XXXX 智能语音助手服务接入指南 1范围 本文件给出了智能语音助手软件开发工具包(SDK)接入智能语音平台的参考框架和接入流程。本 文件适用于智能语音助手SDK的设计和开发。 2规范性引用文件 2 本文件没有规范性引用文件。 3术语和定义 下列术语和定义适用于本文件。 3.1 智能语音平台intelligent voiceplatform 一种综合性的技术基础设施,提供语音识别、语音合成、自然语言处理等多种语音技术服务,支持 开发者构建各种语音应用。广泛应用于智能家居、车载系统、客服系统、机器人等多个领域,为各类智 能设备和用户提供语音交互能力,提供了全面的语音处理能力,涵盖语音识别、语音合成、自然语言处 理、语音对话管理等多个模块。 3.2 智能语音助手intelligentvoiceassistant 基于智能语音平台开发的应用程序,使用户能够通过语音与设备进行对话,实现语音交互场景的控 制和用户互动。核心功能包括:语音平台的鉴权、将音频流传输至语音平台、接收并分发语音技能,以 及上报当前设备状态等。 3.3 智能语音助手APi接intelligentvoiceassistantapplicationprogramminginterface 一种软件接口,允许第三方开发人员集成智能语音助手的功能,并访问其数据。 3.4 智能语音助手sDKintelligentvoiceassistantsoftwaredevelopmentkit 套开发工具和资源,用于集成语音功能到应用程序中。它提供了一系列的API接口和库,开发者 可以使用这些工具来实现语音识别、语音合成、语音转换等功能。 4缩略语 3 YD/T XXXX-XXXX 下列缩略语适用于本文件。 API 应用程序编程接口 ApplicationProgrammingInterface APP 应用软件 Application ASR 自动语音识别 Automatic Speech Recognition HTTPS 超文本传输安全协议 Hypertext Transfer Protocol Secure ID 身份证件 Identification IP 网际互联协议 Internet Protocol MAC 媒体存储控制 Media Access Control NLP 自然语言处理 Natural Language Processing SDK 软件开发工具包 Software Development Kit TCP 传输控制协议 Transmission Control Protocol TTS 从文本到语音 TextTo Speech URL 统一资源定位器 Uniform Resource Locator 语音助手接入参考框架和接入流程 5 5.1接入参考框架 语音助手部署在终端的接入参考框架见图1。 云端技能 生活服务 智能家居服务 影视点播服务 问答咨询服务 服务平台 云端API接口 NLP服务 智能语音平台 语音合成 语音对话管理 语音助手API 智能语音助手 智能音箱、智能电视、智能 SDK 投影仪等生态硬件 图1接入参考框架 本文件标准化智能语音助手SDK开发者通过语音助手API接入智能语音平台的接入流程,其中智 能音箱、智能电视、智能投影仪等生态硬件在本文件下文中统称智能终端。 智能语音平台通过云端API接口调用云端技能服务平台具备的第三方应用服务,具体协议参见 附录A.1。 智能终端通过语音控制的整个流程参见附录A.2。 5.2接入流程 5.2.1申请初始化 4 YD/T XXXX-XXXX 接入过程中需要申请APP-ID、语音平台型号等鉴权产品,并提前将设备的唯一标识、MAC地址和 签名密钥导入语音平台。 5.3开启对话 5.3.1SDK初始化 在使用SDK的任何其他语音功能之前,首先需要进行SDK初始化。初始化过程包括注册认证、业 务通道认证等,具体的认证流程见图2。 终端语音助手 智能语音平台 ..... 智能终端向平台发送认证请求 注册 认证 平台对智能终端进行认证响应 建立TCP长连接,发送认证消息 业务 通道 认证 认证响应消息 心跳包保活请求 心跳包 保活 4 心跳包响应 图2SDK初始化参考框架 SDK认证初始化流程如下: 智能终端设备向语音交互平台发送认证请求消息,并上报以下信息:设备厂商、型号、MAC a) 地址、软件版本、硬件版本、通信接口版本、P地址等 b) 智能终端设备先向语音平台进行HTTPS请求,并上报设备标识信息,签名串、协议版本号、 设备支持编解码,设备类型等信息。平台根据上报设备标识信息,判断是否是合法设备,如果 是合法设备,返回当前设备的使用令牌; 智能终端在获得使用令牌后,会发起TCP长连接鉴权请求。在TCP连接建立后,设备会发送 c) 当前设备的使用令牌进行鉴权。平台接收到令牌后进行校验,校验通过则返回登录成功的消息; (p 设备端接收到TCP登录成功消息后,将维持心跳机制。每发送一个心跳包,服务端需回复 个心跳包。如果设备端连续发送三个心跳包未收到服务端回复,将重新进行TCP鉴权登录。 5 YD/T XXXX-XXXX 5.3.2唤醒服务授权 语音助手在使用三方语音识别能力时,需要获取唤醒授权,并根据唤醒授权情况授权唤醒服务给智 能终端。 智能终端 智能语音平台 ASR服务平台 获取声学 授权请求包 音箱首次认证 请求授权包 授权包响应- 一一一首次认证响应- 本地声学授权 声学授权 结果反馈 反馈响应 图3SDK唤醒服务授权流程框架 SDK唤醒服务授权流程框架见图3,具体流程如下: a) 智能终端设备获取本地声学授权请求包,并在取得该请求包后,携带授权请求包发起注册认证 的HTTPS请求。平台根据上报的设备标识信息判断设备是否合法。如果设备合法,平台将基 于设备请求中携带的声学授权请求包,向ASR服务平台请求进行声学授权; ASR服务平台进行唤醒授权流程,并响应唤醒授权包。智能语音交互平台在获取授权响应包 b) 后,返回当前设备的使用令牌,并将唤醒授权响应包返回给设备; 智能终端设备根据唤醒授权响应包执行本地唤醒授权流程,并将唤醒授权结果上报至平台, c) 6

.pdf文档 YD-T 6481-2025 智能语音助手服务接入指南

文档预览
中文文档 9 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共9页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
YD-T 6481-2025 智能语音助手服务接入指南 第 1 页 YD-T 6481-2025 智能语音助手服务接入指南 第 2 页 YD-T 6481-2025 智能语音助手服务接入指南 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2026-01-25 04:22:46上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。