标题 | 人机语音交互存在的问题研究 |
范文 | 叶子 摘 要 随着计算机技术的飞速发展,人机交互形式已经发展到自然交互界面。语音交互就属于自然交互方式的一种。但是目前来看,人机语音交互仍存在局限性,并不能算 非常自然的交互方式。本文将以诺曼在《设计心理学》提出的“匹配原则”为出发点,并从“操作层”“功能层”“情感层”几个方面探讨研究目前语音交互中存在的问题。 关键词 语音交互;自然交互;匹配原则 中图分类号 TP3 文献标识码 A 文章编号 1674-6708(2017)178-0031-02 1 语音交互发展概况 随着计算机技术的飞速发展,人和计算机的交互已经从早期的手工作业阶段、作业控制语言及交互命令行界面阶段(CLI)、图形用户界面阶段(GUI)、发展到如今的的自然用户界面阶段(NUI)。自然用户界面是一种“对用户隐形计算机用户界面”,即是指用户可以摆脱传统的鼠标和键盘等物理机器设置,用最自然的方式与机器互动。自然交互的概念由此而来。所谓自然交互,关键在于“自然”,它是指在用户在与产品的交互过程中,能利用自身的固有认知和生活行为习惯以一种非精确的自然行为与产品进行沟通交流并能够被理解的交互方式[ 1 ]。人机语音交互就是属于当前自然交互的一种,指的是人通过语音的方式与计算机进行交流互动,来完成自己的任务。 2011年苹果公司在iPhone4s中开创了Siri智能语音助手,在全球引发了语音热潮,用户只需要对着手机的麦克风说几句话,系统就能跳过繁琐的操作步骤唤起并实现用户想要的功能;现如今的智能手机中都已经集成了语音交互功能,例如苹果手机的Siri、谷歌在安卓平台上推出的Google Now、微软公司的Cortana等。语音交互的价值也愈发凸显,通过听觉的方式作用于用户能够在很大程度上缓解用户的视觉疲劳,从而降低因为疲劳而引发的误操作,提高了输入的效率,让输入更加简单、便捷;对于老人、视觉障碍人士等输入有困难的群体而言,语音交互帮助他们摆脱了复杂的键盘操作,减少了产品的使用障碍。 语音输入成为继键盘、鼠标之后我们与机器交流的又一重要方式,并且在声控命令、操作方式以及人工智能方面均有望产生更大的价值,但在达到这个期望阶段之前,语音交互仍有一段很长的路要走,就目前而言,语音交互并不能算作是非常自然的一种交互方式,它仍然存在着很多问题。 2 语音交互存在的问题研究 在如何设计出好的产品这个问题上,美国设计心理学学者诺曼(Norman)在他所著的《设计心理学》提出了匹配原则[ 2 ]。他指出匹配是指两种事物之间的适应关系。他认为用户头脑中有一个心智模型,产品的设计者头脑中也有一个心智模型,在系统里应该让这两者尽可能的匹配,从而让用户容易学习、使用产品,来实现较高的效率和满意度。例如,Windows系统桌面上的“回收站”,其外形与现实生活中的垃圾桶很相似,让用户能够将回收站与生活中的垃圾桶对比,便能自然地联想出回收站是将废弃的文件丢掉的地方。 在笔者看来,自然匹配就是指在用户和产品之间有一个明确又良好的映射,用户在操作产品时可以依据固有的知识和经验能很容易地明白如何使用产品,并且能从操作本身看出它产生的结果。从某个角度来讲就是指操作是否与用户的心理预期一致,并且两者越一致,用户对产品的满意度就越高。受诺曼“匹配原则”的启发,笔者尝试从心理匹配的角度去分析当前人机语音交互中的一些局限性。并从产品设计3个层次“操作层”“功能层”“情感层”来对语音交互目前存在的问题进行分析研究。 2.1 操作层匹配 语音交互从诞生之日起就被委以“解放双手”的重任。但目前来看,语音并没有十分有效地“解放双手”,例如苹果手机用户需要长按主屏Home键才可以唤起Siri语音助手,在同Siri交流时也需要多次用手进行操作。对于“没有解放双手”的原因,笔者认为,语音交互本质上是人和计算机的沟通交流,就像我们平常的对话一样,而这种交流应该是没有屏障的。那么人机之间存在的界面就是对这种自然对话的违背。虽然都说“语音交互解放了双手”,但实际上,界面的存在是不可能完全解放双手的。 在界面统领一切的计算机时代,用户似乎已经习惯在界面上处理一切事物,但界面旳存在,实际上大大阻碍了人机交互的通畅,因为界面并不代表任务本身。在现实的人机交互情境中,人们迫于压力和约束,又必须把自己的某一部分心智和精力,放到各种复杂的界面识别和操作当中,人的思维、情绪很容易被一个没有任何变化任何起伏的设备所打断,从而有可能损耗互动效率。就语音发展的长远性来看,要想真正彻底地解放双手,必须尽量降低我们在使用语音功能时对界面的依赖程度。 2.2 功能层匹配 虽然Siri引爆了语音市场,语音识别系统进入商品化阶段,但是就目前的发展水平看,还远没有达到人类与机器自然交流的终极目标。语音识别的精确度不高是制约语音交互发展的最大障碍之一。而语音识别技术是解决人机语音交互问题的关键核心技术之一,虽然取得了一定的发展,但仍有很多问题亟待解决。目前語音识别面临的技术难点主要包括:1)语音中语法语义规则的建立和理解很困难,尤其对于中文一词多意的语言来说更为困难;2)方言、口音严重影响语音的正确识别;3)字母、单词等发音很容易受到上下文环境的影响,音调、因素、重音等可能都会有很大的差别;4)环境噪声和干扰童颜能够严重影响语音的识别率;5)对于情感识别而言,语言中的情感过于微妙,就目前技术来说,想要识别是有点不切实际的[ 3 ]。 语音识别精确度不高,就会妨碍用户去完成任务,甚至会导致哭笑不得的结果。例如微博上曾经的有一条热门就是山东大汉在开车时与智能车载语音对话,因语音技术对方言或口音的识别能力不佳,而导致车载系统对山东大汉所报的电话号码数字一直识别不了而闹出了一些笑话。在面对这种不能避免的错误的情况时,系统应该提供相应的错误机制,提醒用户切换方式,避免用户反复进行自己的操作而不能完成任务。而当前大多数语音交互系统错误操作的应对能力并不好,而且系统反馈不佳,导致用户很容易对产品丧失信心。因此,在人机交互时,语音系统应该及时向用户提供反馈,让用户知道某一操作是否已经完成以及操作所产生的结果;在面对用户的误操作时,也要有相应的错误机制帮助用户了解发生的错误。例如用户在进行语音输入时,被外部环境突然打断,系统就应该在被打断时有相应的错误机制,当用户下次重新录入时,系统应该保存了之前的输入;或者如果不能有这样的保存,也应该有所反馈,提醒用户上次的输入曾被打断,并表示如果要继续,请重新开始。 2.3 情感层匹配 语音交互的操作层匹配和功能层匹配都不是特别好,可想而知其情感层面的匹配性也不好。情感层的设计关注的是产品是否满足了人们的感性心理需求。人机交互设计不仅是交互界面、功能模块、操作方式等的“有形”设计,同时也是涉及到人的知觉、态度以及情感等的“無形”的设计。“有形”的设计是基础,“无形”的设计是用户感到满意的关键所在,只有“有形”和“无形”之间相当的契合才能实现高质量的人机交互[ 4 ]。人机语音交互亦是如此。只有在操作层面、功能层面满足了用户的期望,并到达情感层后,用户才会在产品易用、高效基础上觉得很有趣,进而把自己的情感投射到产品中。只有在产品和用户之间建立起了情感的纽带,产品的价值才会得以体现。 例如,2014年科幻电影《她》中主人公就因为声音爱上了操作系统,而声音的表演者斯嘉丽也仅凭声音摘得影后桂冠。在一切智能自然化的未来社会中(即一切都满足“自然匹配”),这种情况是有可能发生的。我们不去探讨这种情况可能引发的“计算机恐慌”,仅就软件系统而言,逼真的、无时不在、知晓一切的智能语音操作系统确实让使用者产生了共鸣,并使其渐渐产生感情。也就是说,包括语音交互在内的人机交互设计应当追求的终极理想是,使用户高效、准确地完成目标后,还能给用户带来心灵上的愉悦和共鸣,满足其情感性需求,使产品的价值得以彰显。 3 结论 综上所述,目前的语音交互确实存在很多“不自然”的问题。笔者以诺曼的“匹配原则”为出发点,从操作层、功能层、情感层3个维度分析了当前语音交互的局限性。根据前面的分析,我们可以尝试通过减少界面操作(取消界面)、提升语音识别技术、提供错误机制和反馈机制等几个方面来提升语音交互的各方面体验。虽然目前的语音交互仍存在很多问题,但毋庸置疑的是语音一定会有一个良好的发展前景,随着技术的提升,未来的智能语音人机交互将会像电影《她》所展现的那样给人类带来全新的智能生活方式。 参考文献 [1]孙传祥.基于自然交互方式的移动终端产品交互设计研究[D].济南:山东大学,2012. [2]唐纳德·诺曼.设计心理学[M].北京:中信出版社,2003. [3]袁彬,肖波,侯玉华,等.移动智能终端语音交互技术现状及发展趋势[J].信息通信技术,2014(2):39-43. [4]程彬,赵宏梅.匹配原则在人机交互设计上的应用探讨[J].包装工程,2008,29(11):125-127. |
随便看 |
|
科学优质学术资源、百科知识分享平台,免费提供知识科普、生活经验分享、中外学术论文、各类范文、学术文献、教学资料、学术期刊、会议、报纸、杂志、工具书等各类资源检索、在线阅读和软件app下载服务。