标题 | 安徽省智能语音产业竞争力分析及发展建议 |
范文 | +陈泰+++张虹冕 摘要:智能语音交互方式是继“鼠标”、“触屏”之后,有望带来突破性技术变革的人机交互方式。安徽省语音产业拥有核心技术基础,语音产业与其他产业呈现深度融合的趋势,是有望带来爆发性经济增长的新兴产业领域。本文概述了智能语音产业领域涉及的关键技术,并利用SWOT模型对安徽省智能语音产业竞争力进行分析,最后提出促进智能语音产业发展的对策与建议。 关键词:智能语音技术竞争力SWOT 一、智能语音关键技术 1.语音合成技术 语音合成技术(Text to Speech,TTS)是让计算机像人一样将要表达的信息以普通人可以听懂的语音播放出来的技术[1]。其关键技术包括:语音声码器、声学参数统计建模方法、参数生成与单元挑选算法、多语种合成技术、语音音色模拟技术等。其未来发展方向包括:提高合成语音的自然度,丰富合成语音的表现力,多语种语音合成等[2]。 2.语音识别技术 语音识别技术(Automatic Speech Recognition,ASR)是解决机器“听懂”人类语音的一项技术。其关键技术包括:克服环境噪声影响的技术,克服说话人距离和位置变化的技术,克服说话人心理和生理变化引起的语音变异的技术等。其未来发展方向包括:克服环境噪声影响,提高语音识别系统对多语种的适应性,提高端点检测技术的稳定性,避免词与词的特征空间混叠[3]。 3.声纹识别技术 声纹识别技术,即说话人识别(Speaker Recognition)是根据获取声音波形中反映说话人生理、心理和行为特征的特征参数来自动识别说话人身份的技术。其关键技术包括:语音特征参数提取技术,模式匹配方法等。其未来发展方向包括:声音辨认领域,声纹确认领域等[4]。 4.共性技术 智能语音关键技术还包括语音评测共性技术、自然语音处理共性技术、少数民族语音及方言共性技术、智能人机语音交互及自主机器人共性技术、语音芯片共性技术、海量语音数据计算及服务共性技术等六大共性技术[2]。 二、智能语音产业竞争力SWOT分析 1.发展优势 专利优势。当前,安徽省涌现出以科大讯飞信息科技股份有限公司、中国科学技术大学为代表的拥有技术积累和成熟技术应用的企事业单位。根据国际专利分类号IPC,G10L类是语音分析或合成、语音识别、音频分析或处理,是语音专利的主要分类区。利用SooPAT专利搜索引擎,截至2013年7月底,我国G10L类专利数8457件,申请人数2307人,大组数445组。表1显示了G10L类我国主要专利申请人分布,科大讯飞专利拥有量位于国内前列。 表1我国G10L类专利主要申请人分布 标准优势。表2显示了现行我国中文语音主要技术标准,由其起草单位可见,科大讯飞作为国内主要语音技术提供商负责牵头制定了中文语音技术标准。对于新兴发展起来的高科技领域而言,率先制订技术标准,在行业内规范技术准入条件,是于市场竞争中实现技术保护的重要手段。 产业化优势。智能语音在安徽省家用电器、车载导航、公共安全领域具有产业化发展优势。安徽省已形成以合肥、滁州、芜湖为主体的知名家电产品集中地,拥有成熟的语音技术应用条件。安徽省汽车产业拥有奇瑞、江淮等自主品牌龙头企业,语音技术运用的拓展将提升其整体技术优势。安徽省公共安全领域汇聚了一批国家级科研院所,公共安全产业基地的建成有望成为语音技术转化运用的又一突破性增长点。 2.发展劣势 缺少平台接入口。在平台接入方面,苹果利用其iPhone iOS平台植入“Siri”应用,Google将语音识别和文本语音转换技术整合到Chrome平台并有望成为行业标准技术,在移动互联网领域,讯飞作为综合性语音技术提供厂商缺少统一的应用平台接入口,限制了其语音产品的应用范围。 缺少数据资源支撑。在语义识别方面,Google、百度、搜狗等搜索引擎厂商,拥有丰富的知识库体系资源,其在语义逻辑分析上可以被利用从而进行深度神经网络训练,提高人机交互的准确性。显然,在融合大数据分析背景之下的人机交互应用领域,讯飞存在数据拥有量先天不足的劣势。 3.发展机遇 政策扶持。在资金投入方面,国家工信部与安徽省均设立专项资金支持安徽省智能语音产业发展。2009年安徽省设立语音产业科技创新专项资金,用于支持语音核心技术研发和应用相关的重大专项。2012年国家工信部与安徽省人民政府签署 《关于共同推进安徽省语音产业发展合作备忘录》,今后五年,工信部每年都将有1亿元专项资金用于支持安徽语音产业发展。 在规划指导方面,安徽省科技厅编制了《安徽省语音产业技术发展指南》(2010-2015年),《指南》对当前安徽省语音产业发展进行战略性布局,筛选出优先发展技术并指导创新平台建设。 在技术示范方面,安徽省将在全省汽车生产企业和115个县(市、区)所辖农村中小学分别建立“语音智能导航示范工程”和“语音智能教学示范工程”,提高语音产品普及率。 平台支撑。“语音及语言信息处理国家工程实验室”、“智能语音技术公安部重点实验室”等国家级科研平台纷纷在皖设立,将加快智能语音核心技术的储备。中国(合肥)国际智能语音产业园也开始规划建设,智能电视研发试验室、呼叫中心基地等项目有望率先入驻,产业园将进一步集聚全国资源,推进语音产业化进程。 市场需求。智能手机语音助手成为消费热点自苹果在iPhone4S iOS平台上推出名为“Siri”的全新语音控制功能,谷歌、微软,百度、搜狗、360、讯飞等信息技术企业也纷纷退出了基于不同语音识别基础的语音助手产品。语音助手产品功能涉及三大方面,具体包括语音搜索功能、生活助手功能、语音问答功能。据预测:2013年中国智能手机出货量将达到3.012亿部,2017年这一数值将达到4.579亿部。智能手机普及率的稳步提高将为智能语音技术利用提供移动终端设备基础。据预测,2013年我国3G用户规模将突破3亿户,用户渗透率超过30%。3G网络覆盖面不断扩大及4G网络即将的落地将为智能语音技术利用在移动终端设备的成熟使用提供资源基础。 车载语音导航嵌入成为趋势。与传统的导航仪器相比,车载语音导航系统可以避免手动输入而通过语音输入迅速完成路线搜索指令,同时完成通讯及娱乐指令,大大提高了驾驶的安全性。福特、上汽集团旗下轿车品牌纷纷推出车载语音导航系统,可以预见未来车载导航系统将成为汽车标配。截至2012年底,我国汽车保有量达1.2亿辆,据预计2013年全国汽车市场增长率约为7%,我国汽车行业将成为语音技术运用的又一热门领域。 4.发展挑战 当前,国际大型IT企业纷纷涉足智能语音行业,其拥有研发资金、技术人员的保障,同时也具备基于其应用平台专有的技术转移优势。以Nuance Communications为例,其是全球最大的专业从事语音技术研发的公司,拥有近4000项专利优势,近年来逐步拓展在华业务。国内智能语音厂商必须抢先树立起行业市场壁垒,才能有效减少竞争劣势所带来的风险。 三、智能语音产业发展建议 1.加速突破语音技术核心算法 语音技术是一门交叉学科,其未来的突飞猛进还依赖于数字信号处理、人工智能、大数据合成等领域技术的突破[5]。数字信号处理主要用来解决语音特征参数的提取问题,人工智能的运用用来加强机器对自然语言的理解,大数据合成技术用是机器进行语义识别所需的样本学习训练的技术基础。由于深度神经网络(DNN)能较好的模拟人脑神经元多层深度传递的过程,DNN开始被运用到语音识别领域中。有研究结果表明,DNN技术将提高语音识别准确率30%左右并提高语音识别的速度。国内语音厂商应注重上述技术的研究突破并加强技术集成。2.积极组建智能语音专利池 国内的清华大学、中国科学院声学研究所、科大讯飞、中科信利、捷通华声、等企事业单位已经积累了一定的语音技术核心专利拥有量,在中文语音识别领域优势明显。国内智能语音行业联盟应利用好专利优势加快组建智能语音专利池,制定专利人入池标准,吸收语音技术专利权人加入联盟,联盟内部成员可以免费共享其他专利权人的专利技术,联盟外部其他厂商付费享有专利池内专利技术,促进语音技术产业规模化发展 [6]。 3.加大拓展个人消费领域智能语音市场 从个人消费品领域来看,我国智能手机、汽车产品、家用电器、教育玩具等市场语音产品需求旺盛,搭载智能语音控制功能的上述产品已逐渐成为消费热点,市场份额逐步扩大。国内智能语音技术提供厂商可加强与相关硬件厂商的深入合作,创新应用模式,拓展语音技术的二次开发和运用。 4.加强产业链上下游企业协同合作 2012年,由科大讯飞、华为、联想、长虹、上海汽车、中国移动等19家单位联合发起的中国语音产业联盟正式成立。作为战略性新兴产业,智能语音产业是我国信息产业中为数不多却掌握自主知识产权并处于国际领先的领域。联盟内企业应着手利用好联盟平台,进行产业链上下游的合作开发,建立互利共赢的机制推动语音技术应用推广。 5.加大政府扶持力度 当前,我国语音产业进入发展的关键期,除了企业协同推进,还需要政府在技术创新、示范推广、人才方面给予重点支持。具体包括整合创新资源建设语音技术公共平台,为企业创新提供技术支撑;积极推动产业链资源整合,以示范工程的方式,推动语音产品的普及利用;引进和培养语音技术高端人才,牵头高校与企业联合成立语音产业人才培养基地等。 四、结论 对安徽省语音产业竞争力进行SWOT分析后,得到表3的结果。安徽省智能语音产业在国内具有领先优势,作为一个新兴发展起来的产业领域,以语音核心技术为基础,要充分纵深延长智能语音产业价值链,面对国外企业纷纷涉足语音产业的竞争形势,更要在核心技术及商业模式上寻求突破创新。 表3 安徽省智能语音产业竞争力SWOT分析结果 *基金项目:安徽省软科学研究计划项目(1302053081) 参考文献: [1]凌震华.基于统计声学建模的语音合成技术研究[M].中国科学技术大学,2008. [2]安徽省创新办.安徽省语音产业技术发展指南(2010-2015)[EB/OL].http://www.ahcxb.gov.cn,2010年2月12日. [3]王敏妲.语音识别技术的研究与发展[J].微型机与应用,2009,23:1-6. [4]朱浩冰,郭东辉.声纹识别体统原理及其关键技术[J].计算机安全,2007,9:14-17. [5]赵展慧,余建斌.语音人机交互新热门[N].人民日报,2013年3月1日. [6]宋伟,翁磊.我国智能语音技术分析与专利池构建[J].科技与法律,2012.1(95):33-37. (作者单位:安徽省科学技术情报研究所,安徽合肥230011)2.积极组建智能语音专利池 国内的清华大学、中国科学院声学研究所、科大讯飞、中科信利、捷通华声、等企事业单位已经积累了一定的语音技术核心专利拥有量,在中文语音识别领域优势明显。国内智能语音行业联盟应利用好专利优势加快组建智能语音专利池,制定专利人入池标准,吸收语音技术专利权人加入联盟,联盟内部成员可以免费共享其他专利权人的专利技术,联盟外部其他厂商付费享有专利池内专利技术,促进语音技术产业规模化发展 [6]。 3.加大拓展个人消费领域智能语音市场 从个人消费品领域来看,我国智能手机、汽车产品、家用电器、教育玩具等市场语音产品需求旺盛,搭载智能语音控制功能的上述产品已逐渐成为消费热点,市场份额逐步扩大。国内智能语音技术提供厂商可加强与相关硬件厂商的深入合作,创新应用模式,拓展语音技术的二次开发和运用。 4.加强产业链上下游企业协同合作 2012年,由科大讯飞、华为、联想、长虹、上海汽车、中国移动等19家单位联合发起的中国语音产业联盟正式成立。作为战略性新兴产业,智能语音产业是我国信息产业中为数不多却掌握自主知识产权并处于国际领先的领域。联盟内企业应着手利用好联盟平台,进行产业链上下游的合作开发,建立互利共赢的机制推动语音技术应用推广。 5.加大政府扶持力度 当前,我国语音产业进入发展的关键期,除了企业协同推进,还需要政府在技术创新、示范推广、人才方面给予重点支持。具体包括整合创新资源建设语音技术公共平台,为企业创新提供技术支撑;积极推动产业链资源整合,以示范工程的方式,推动语音产品的普及利用;引进和培养语音技术高端人才,牵头高校与企业联合成立语音产业人才培养基地等。 四、结论 对安徽省语音产业竞争力进行SWOT分析后,得到表3的结果。安徽省智能语音产业在国内具有领先优势,作为一个新兴发展起来的产业领域,以语音核心技术为基础,要充分纵深延长智能语音产业价值链,面对国外企业纷纷涉足语音产业的竞争形势,更要在核心技术及商业模式上寻求突破创新。 表3 安徽省智能语音产业竞争力SWOT分析结果 *基金项目:安徽省软科学研究计划项目(1302053081) 参考文献: [1]凌震华.基于统计声学建模的语音合成技术研究[M].中国科学技术大学,2008. [2]安徽省创新办.安徽省语音产业技术发展指南(2010-2015)[EB/OL].http://www.ahcxb.gov.cn,2010年2月12日. [3]王敏妲.语音识别技术的研究与发展[J].微型机与应用,2009,23:1-6. [4]朱浩冰,郭东辉.声纹识别体统原理及其关键技术[J].计算机安全,2007,9:14-17. [5]赵展慧,余建斌.语音人机交互新热门[N].人民日报,2013年3月1日. [6]宋伟,翁磊.我国智能语音技术分析与专利池构建[J].科技与法律,2012.1(95):33-37. (作者单位:安徽省科学技术情报研究所,安徽合肥230011)2.积极组建智能语音专利池 国内的清华大学、中国科学院声学研究所、科大讯飞、中科信利、捷通华声、等企事业单位已经积累了一定的语音技术核心专利拥有量,在中文语音识别领域优势明显。国内智能语音行业联盟应利用好专利优势加快组建智能语音专利池,制定专利人入池标准,吸收语音技术专利权人加入联盟,联盟内部成员可以免费共享其他专利权人的专利技术,联盟外部其他厂商付费享有专利池内专利技术,促进语音技术产业规模化发展 [6]。 3.加大拓展个人消费领域智能语音市场 从个人消费品领域来看,我国智能手机、汽车产品、家用电器、教育玩具等市场语音产品需求旺盛,搭载智能语音控制功能的上述产品已逐渐成为消费热点,市场份额逐步扩大。国内智能语音技术提供厂商可加强与相关硬件厂商的深入合作,创新应用模式,拓展语音技术的二次开发和运用。 4.加强产业链上下游企业协同合作 2012年,由科大讯飞、华为、联想、长虹、上海汽车、中国移动等19家单位联合发起的中国语音产业联盟正式成立。作为战略性新兴产业,智能语音产业是我国信息产业中为数不多却掌握自主知识产权并处于国际领先的领域。联盟内企业应着手利用好联盟平台,进行产业链上下游的合作开发,建立互利共赢的机制推动语音技术应用推广。 5.加大政府扶持力度 当前,我国语音产业进入发展的关键期,除了企业协同推进,还需要政府在技术创新、示范推广、人才方面给予重点支持。具体包括整合创新资源建设语音技术公共平台,为企业创新提供技术支撑;积极推动产业链资源整合,以示范工程的方式,推动语音产品的普及利用;引进和培养语音技术高端人才,牵头高校与企业联合成立语音产业人才培养基地等。 四、结论 对安徽省语音产业竞争力进行SWOT分析后,得到表3的结果。安徽省智能语音产业在国内具有领先优势,作为一个新兴发展起来的产业领域,以语音核心技术为基础,要充分纵深延长智能语音产业价值链,面对国外企业纷纷涉足语音产业的竞争形势,更要在核心技术及商业模式上寻求突破创新。 表3 安徽省智能语音产业竞争力SWOT分析结果 *基金项目:安徽省软科学研究计划项目(1302053081) 参考文献: [1]凌震华.基于统计声学建模的语音合成技术研究[M].中国科学技术大学,2008. [2]安徽省创新办.安徽省语音产业技术发展指南(2010-2015)[EB/OL].http://www.ahcxb.gov.cn,2010年2月12日. [3]王敏妲.语音识别技术的研究与发展[J].微型机与应用,2009,23:1-6. [4]朱浩冰,郭东辉.声纹识别体统原理及其关键技术[J].计算机安全,2007,9:14-17. [5]赵展慧,余建斌.语音人机交互新热门[N].人民日报,2013年3月1日. [6]宋伟,翁磊.我国智能语音技术分析与专利池构建[J].科技与法律,2012.1(95):33-37. (作者单位:安徽省科学技术情报研究所,安徽合肥230011) |
随便看 |
|
科学优质学术资源、百科知识分享平台,免费提供知识科普、生活经验分享、中外学术论文、各类范文、学术文献、教学资料、学术期刊、会议、报纸、杂志、工具书等各类资源检索、在线阅读和软件app下载服务。