简单剖析智能语音交互技术

author author     2022-12-21     218

关键词:

机器学习和自然语言处理技术的进步为语音与人工智能的交互提供了可能。人们可以通过对话获得信息,并与机器互动,而机器将不再只存在于科幻小说中。语音交互是未来的发展方向。智能扬声器是语音交互着陆的第一代产品。

以市面上面流行的智能电话机器人为例,他的AI模块主要包含了4部分自动语音识别(Automatic Speech Recognition, ASR),自然语言理解(Natural Language Understanding, NLU)
,自然语言生成(Natural Language Generation, NLG),文字转语音(Text to Speech, TTS)

技术图片
以欧能智能机器人中的语音交互流程图为例子,来看看Ai智能机器人对话技术的主要路径:
技术图片
在上图我们可以看到,用户使用的时候是与设备进行交互完成的,并且主要是采用语音的处理方式。

要想完整完整的完成语音交互,必须要弄懂流程,这是一款电话机器人好不好用的关键,一次成功的语音交互流程,主要涉及以下4个阶段,且环环相扣。

意图
表示用户在使用应用时所做的动作(譬如:问一个问题或发送一条指令),这些意图代表了应用的核心功能。如果应用成功地识别了用户意图,则需要在完成业务动作后,将结果反馈给用户。

识别意图—语义解析
对语音识别结果进行分析理解,简单来说就是将用户语音输入映射到机器指令。它可能定义了一组包含指定的单词或短语的语法结构,用户通过说出满足这种结构的语句,来调用意图。

处理意图—云端交互
调用意图的结构化请求,向服务器请求处理后做出反馈响应。 通俗来讲该流程主要处理用户的请求,解决用户问题的答案。

语言合成模块 – 组织语言
根据解析模块得到的内部表示,在对话管理机制的作用下生成自然语言句子。 同时将生成模块生成的句子转换成语音输出。(把回答的机器语言再转换成 口语语言)

整个流程虽然看起来较为简单,但是中间的自然语言处理的关键技术是必须要掌握的。

词法分析
词汇分析包含形态和词汇。一般来说,形态素主要反映在单词的前缀和后缀的分析上,词汇反映在整个词汇体系的控制上。在中文全文检索系统中,在中文信息、即中文自动单词分割技术的单词分割中,词汇分析主要出现。利用该技术,能够正确解析用户输入信息的特性,完成正确的搜索过程。是中文全文检索技术的重要发展方向。

句法分析
句法分析是对用户输入的自然语言进行词汇短语的分析,目的是识别句子的句法结构,实现自动句法分析过程。其基本方法有线图分析法、短语结构分析、完全句法分析、局部句法分析、依存句法分析等。

语义分析
语义分析是基于自然语言语义信息的一种分析方法,其不仅仅是词法分析和句法分析这样语法水平上的分析,而是涉及到了单词、词组、句子、段落所包含的意义。其目的是从句子的语义结构表示言语的结构。中文语义分析方法是基于语义网络的一种分析方法。语义网络则是一种结构化的,灵活、明确、简洁的表达方式。

语用分析
语用分析相对于语义分析又增加了对上下文、语言背景、环境等的分析,从文章的结构中提取到意象、人际关系等的附加信息,是一种更高级的语言学分析。它将语句中的内容与现实生活的细节相关联,从而形成动态的表意结构。

语境分析
语境分析主要是指对原查询语篇以外的大量“空隙”进行分析从而更为正确地解释所要查询语言的技术。这些“空隙”包括一般的知识,特定领域的知识以及查询用户的需要等。它将自然语言与客观的物理世界和主观的心理世界联系起来,补充完善了词法、语义、语用分析的不足。

?智能电话机器人对话目前存在的问题
在人与机器的会话过程中,用户必然会犯表达错误,导致用户语言机械理解的偏离。此时,错误修正机构对于机器来说非常重要。如果这个机制不能利用,用户显然需要花费很长时间来说明他们的意图,并且对应的用户经验非常坏吧。另一方面,能够很好地认识语音,但是不能理解对话的目的,有理解意义的偏颇。因此,语音对话中应解决的问题是模糊消除和未知语言现象的处理。

智能语音助手背后的生态服务
一个好的智能电话机器人要想落地开花,它不仅仅是简单的语音识别那么简单,还有集成服务,一整套的中文生态、内容、服务等配套设施,是一种涵盖很多基础能力的生态系统。
未来基于语音交互的语义技能,必须要能够达到几万、几十万甚至上百万种的时候,才能促使语音交互时代操作系统真正走向成熟,未来语音交互产品的形态和样式也将越来越丰富。

bixby的ai语音,能否推进人机交互进程?

...个业界关注的焦点。2011年苹果公司推出的Siri作为第一款智能手机语音交互技术,一定程度上为整个智能手机的语音交互趋势掀开了序幕,但Siri只能通过关键词为中心的生硬回答并没有带给用户太大便利。之后,一些智能手机厂... 查看详情

ai语音对话技术

...机器学习以及自然语言处理技术的进步,开启了人与人工智能进行语音交互的可能,人们透过对话的方式获取信息、与机器进行交互,将不再只是存在科幻情结当中。语音交互是未来的方向,而智能音箱则是语音交互落地的第一... 查看详情

转:it巨头纷纷“卡位”智能语音成人机交互入口必争之地

...sp;   随着物联网的迅速发展,作为重要接口的智能语音技术已成为国内外IT巨头的必争之地。上周,阿里推出了自己的首款智能音箱产品,百度宣布收购美国语音交互技术公司,而此前,亚马逊、谷歌、苹果、微软等... 查看详情

阿里云产品-智能语音交互快速测评(代码片段)

个人感觉阿里[智能语音交互](https://ai.aliyun.com/nls?spm=a2c6h.27949115.J_4502519820.2.60212cedNml1bw)产品的精度还是很高的,通过sdk的方式嵌入在其他代码中也很方便,可以应用在工业界产品中,比如智能音箱。虽然有诸多优点,但再完美的... 查看详情

音箱语音交互技术,乐鑫esp32-h2芯片应用,无线wifi芯片模组

...物联网连接性的需求增加。伴随物联网的落地实现,智能语音交互的场景(如智能家居等)变得越来越多,而智能音频SoC芯片为智能终端设备的核心器件& 查看详情

vivo手机中的语音唤醒啥意思

...音交互成为最直接的控制方式,AmazonEcho作为最佳代表,智能语音交互成为互联网入口的新价值所在。ABIResearch在2017年収布的预测报告指出,估计到2022年,支持语音控制的装置出货量将达到7500万台,其中智能喇叭/数位语音助理... 查看详情

多种汉语方言语音落地应用,微软智能语音解锁更多交互场景

多年来,微软持续探索AI语音合成与识别技术,获得了大量成果:AzureNeuralTTS(text-to-speech,语音合成)与STT(speech-to-text,语音识别)支持的语言区域达到140余个,并支持超过400多个音色ÿ... 查看详情

haas云端一体智能语音交互方案

1、方案背景智能语音交互作为物联网领域的一个重要生态成员,是一种全新的交互方式,它能够解放双手,随时提供服务,无须借助任何按键。近年来智能家居逐渐走入千家万户,产业市场规模不断增长。智... 查看详情

ocr+人工智能,未来更完美

...能再度引起了众人的注视。人工智能当然不止会下棋这么简单,其实早在20年前智能家居的开发就有不少团队在进行,只不过切入点不对,所以一直没什么起色。资深的市场营销和战略咨询专家王煜全提出:人工智能时代语音交... 查看详情

科大讯飞是题库出题还是本班老师出题

...机语音交互,使人与机器之间沟通变得像人与人沟通一样简单2023科大讯飞校招笔试测评考什么?快来看这是不是你想要的笔试真题!职题库你的求职笔试神器。科大讯飞2023校园招聘已经开始,笔试测评时间:2022年9月28日... 查看详情

爆肝一周,用python在物联网设备上写了个智能语音助手-阿里云智能语音交互

基于HaaS云端一体框架,用Python打造HaaSEDUK1智能语音助手的过程中需要用到云端能力。本篇文章介绍如何开通阿里云智能语音交互,并创建配置语音识别及语音合成项目,获取Appkey。请参考《爆肝一周,用Python在物... 查看详情

多种汉语方言语音落地应用,微软智能语音解锁更多交互场景

...细腻的情感,与真人声音不相伯仲。目前,微软智能语音已赋能超过100个国家合作伙伴的产品及服务,共同打造了语音交互生态。近两年,微软在汉语方言智能语音上加大了研究力度,在语音合成上实现了对... 查看详情

如何实现离线语音控制

...的Nrk2201:NRK2202-A01模块是专用于物联网交互及控制领域的智能MCU模块。该智能模块基于目前最先进的深度神经网络(DNN-HMM)语音识别技术,实现了高识别率、高实时性、本地和云端结合、高度一体化的语音识别及处理功能;可以实现... 查看详情

飞桨paddlespeech语音技术课程—语音唤醒(代码片段)

...术课程,点击链接可直接运行源码)1.KWS概述随着人工智能的飞速发展,市场上推出了各式各样的智能设备,AI语音的发展更是使得语音助手成为各大智能终端设备必不可少的软件。语音是人类与设备最直接的交互方式&... 查看详情

腾讯毛华:智能交互,ai助力下的新生态

...讯云语音云总经理-毛华,在云+未来峰会上做了主题为《智能交互,AI助力下的新生态》的分享,以下内容整理自演讲。毛华:前面很多专家讲了腾 查看详情

语音识别技术如何突围?搜狗走了一条音视觉结合之路

...科幻电影《Her》中的虚拟助理(女友),大概是人们对人工智能美好的憧憬,尽管这一天可能还很遥远。  为了实现这一技术突破,前几年行业更多聚焦语音交互各个难题,而近两年,一些技术先行者开始尝试将语音、视觉、文... 查看详情

chatgpt-语音助手

...理等技术,帮助人们完成各种任务和提供各种服务的人工智能系统。它们通常可以在智能手机、智能音箱、车载系统和家庭自动化系统等设备中使用,帮助人们与设备交互和控制设备。语音助手的发展可以追溯到20世纪80年代初... 查看详情

智能电话机器人,使用microsoft语音识别技术(speechsdk)(下)

...ecureCRT连接串口,敲入些AT命令,看看Modem能否执行.  这里简单说一下AT命令:    AT命令有两种解释一种是调制解调器命令语言,简单来说就是一些固定格式的字符串,我们通过串口向Modem发送AT命令的字符串,Modem就会按照   ... 查看详情