网站首页  词典首页

请输入您要查询的论文:

 

标题 嵌入式Linux平台下百度AI语音识别的应用
范文

    胡锐 孙先松

    摘要:随着人工智能技术的发展,语音识别已经成为了最热门的应用之一。语音识别在一些特定的领域和特定的情景下,有着不可替代的作用。而人们生产、生活的需要,特别是物联网的发展,推动了嵌入式和语音识别的结合。本设计应用了Qt的可移植性,在ARM9的平台上使用百度AI实现了语音识别功能。通过WM8976g声卡模块采集语音,在LCD显示语音特征信息,实现语音识别功能。

    关键词:ARM9;语音识别;百度AI;Qt

    中图分类号:TP391 文献标识码:A 文章编号:1009-3044(2018)27-0202-03

    语言作为人类在自然界中最显著的特征,具有方便、快捷、自然和準确性高等特点。这些年,随着人们生活水平的提高,人们对生活方式有了新的要求,传统的控制方式越来越不能满足人们的需求。随着人工智能的推广,其中作为主要组成部分的语言识别得到社会越来越多的关注。现在,语音识别技术在日常生活中也应用的越来越多,人们的生活也越来越方便,对语音识别方面的研究是必然的,有用的。

    语音识别技术一直都是控制技术的主要研究方向。在一些特定的领域和时间、地点,有着不可代替的作用。例如,为了提高生活质量,现在正在高速发展的智能家居就是语音识别的进一步的应用;对于平常我们用得最多的嵌入式设备——手机,几乎所有的智能手机都安装有语音助手来方便用户的使用;在公共场合,对于盲人等行动不便的群体,使用语音识别更是必不可少的。

    语音识别系统一般都被运行在嵌入式和PC机上。虽然PC机和嵌入式设备相比有存储空间大、运行速度快和运行能力强等优点,但是价格较高,体积大,最重要的是不方便携带,这些都限制了语音识别在PC上的使用范围。基于上面的原因,人们都偏爱于体积小、价格低、功耗低并且方便携带的嵌入式系统,而嵌入式语音系统应时而生,符合社会的需求。

    本系统采用ARM9构架的S3C2440作为主控芯片,利用Linux系统作为底层操作系统,Qt作为外包应用层,来操作WM8976g采集指定频率的声音信号,并把采集到的音频传于Ubuntu服务器,Ubuntu服务器和百度AI进行交互后,在开发板的TFT显示屏上打印百度AI返回的转换为文本的语音信息。

    1 嵌入式语音识别系统的设计

    1.1 嵌入式系统中的硬件设计方案

    本语音识别系统应用的主控芯片为S3C2440。S3C2440是韩国三星公司研发的一款基于ARM9构架的32位CMOS微控制器。并使用WM8976g采集声音信号,百度AI提供语音处理接口,并在S3C2440控制的TFT显示屏上打印返回信息,软硬件自己剪裁。

    1.2 嵌入式系统的系统设计方案

    开发嵌入式系统,在最基本的硬件之上,需要根据实际的需要,搭建相应的系统,为后面的应用层的使用创建环境。这里使用的是Linux操作系统,Linux是一套自由传播并且免费使用的类Unix操作系统,是一种支持多用户、多线程、多用户、多CPU的操作系统。严格的来讲。Linux本身只代表 Linux内核,在使用中,人们习惯于用Linux来代表整个Linux操作系统。

    由于在精简小巧的嵌入式系统上,资源有限,通常我们开发是都是在PC上完成有关程序的编写和测试,但是由于目标平台(ARM开发板)和宿主平台(LinuxPC机)构架不同,在PC上编写、编译的程序不能直接在目标平台上直接运行,为了让目标平台可以运行PC机编译生成的结果,在嵌入式开发过程中,通常使用交叉编译工具来生成目标平台可以运行的可以可执行文件,所以交叉编译环境的搭建是必不可少的一步。

    在搭建整个Linux嵌入式系统时,需要用到的工具包括:

    1) arm-linux-gcc-4.4.3.tar.gz

    2) linux-2.6.22.6.tar.bz2

    3) tslib-1.4.tar.gz

    4) u-boot-1.1.6.tar.bz2

    5) busybox-1.22.1.tar.bz2

    6) Qt-everywhere-opensource-src-5.6.0.tar.gz

    在本次设计中,第一步需要做的是在虚拟机中安装Ubuntu16.04操作系统,并在操作系统中配置好交叉编译的环境,方便后面交叉编译工具的使用。

    在arm-linux-gcc-4.4.3的环境下,修改并交叉编译u-boot-1.1.6,并移植u-boot到s3c2440开发平台。使用u-boot启动arm-Linux编译通过的Linux内核,内核进一步挂接arm-Linux编译生成好的文件系统,并在文件系统加入Qt5.6的开源库,为后面应用层的实现提供头文件和库函数。

    1.3 嵌入式系统设计的软件设计方案

    在设计中,考虑到整个系统的整体性和可移植性,决定在基于Linux嵌入式系统下移植Qt5.6版本的opensource开发库,并应用QtCreator为整个设计提供应用层。

    Qt是奇趣公司研发的一款跨平台C++图形用户界面的程序制作框架。除了制作GUI界面外,还可以用来制作服务器和控制台工具。Qt这个词严格来说是指用于C++语言开发的开源库,一般情况下需要于QtCreator或者QTSDK联合使用。

    1.3.1 制作客户端GUI

    在Windows环境下,在Qt官网下载并安装好基于Qt5.6的QtCreator,并完成相应GUI的制作。其中包括三个PushButton和一个TextBrowser控件,三个PushButton分别用来实现录音、结束录音、发送录音,TextBrowser打印状态和错误信息。

    1.3.2 在GUI中功能的实现

随便看

 

科学优质学术资源、百科知识分享平台,免费提供知识科普、生活经验分享、中外学术论文、各类范文、学术文献、教学资料、学术期刊、会议、报纸、杂志、工具书等各类资源检索、在线阅读和软件app下载服务。

 

Copyright © 2004-2023 puapp.net All Rights Reserved
更新时间:2025/3/15 14:06:31