多种汉语方言语音落地应用,微软智能语音解锁更多交互场景

AI科技大本营 AI科技大本营     2023-01-20     285

关键词:

多年来,微软持续探索 AI 语音合成与识别技术,获得了大量成果:Azure Neural TTS(text-to-speech,语音合成)与 STT(speech-to-text,语音识别)支持的语言区域达到 140 余个,并支持超过 400 多个音色,并具有丰富细腻的情感,与真人声音不相伯仲。目前,微软智能语音已赋能超过 100 个国家合作伙伴的产品及服务,共同打造了语音交互生态。

近两年,微软在汉语方言智能语音上加大了研究力度,在语音合成上实现了对吴方言和粤方言两种汉语方言,以及西南官话、东北官话、冀鲁官话、中原官话(包括河南、陕西地区)等多种官话次方言的支持;在语音识别上支持吴方言、粤方言和西南官话,受到了众多企业客户的青睐,也得到了终端用户的认可。

值此辞旧迎新之际,微软智能语音为大家送上新春祝福!一起感受方言朗读的独特魅力。

中原官话(河南)音频:

https://ttspublic.blob.core.windows.net/nickzhao/yuanri-henan.wav

中原官话(河南)朗诵的北宋王安石的《元日》

方言版智能语音需求日益增多

智能家居领域,使用智能语音控制空调、电视、电灯等家居产品已经越来越常见。在与智能机器人的对话中,人们往往需要使用标准普通话以得到准确的反馈,但一些习惯使用方言的用户群体——比如家中的老人可能更倾向使用方言进行交流。因此,若智能家居企业在产品中引入方言语音,便能更好地满足人们对不同方言使用的需求。

以吴方言(上海)与智能空调进行交互:

吴方言(上海)音频:

https://ttspublic.blob.core.windows.net/nickzhao/shanghai.wav

侬好,已为侬打开空调,并将温度调低至 25 度。稍后还有其它需要,可以随时呼叫我。

智能导航领域,各大地图厂商将"声音"作为吸引客户的重要卖点,纷纷推出了明星语音包、幽默风趣的相声语音包等等。近两年,越来越多的用户认为方言会让他们感觉更亲切、熟悉,也更容易理解。

以东北官话(辽宁)进行的语音导航:

东北官话(辽宁)音频:

https://ttspublic.blob.core.windows.net/nickzhao/liaoning.wav

我们已经驶入 2022 年冬季,冬天常常与雪为伴,温度将至零下,路面易结冰,所以请减速减速再减速。注意两百米后有一个小小的急转弯,但道路湿滑也容易让你漂移,请收油慢行。前方路口行人较多,还请踩下刹车,不要让它成为摆设。

影视配音中,来自众多地域的不同角色,有时需要搭配方言才能更好地呈现人物形象。比如,角色设定来自东北,性格热情豪爽、快言快语,如果以普通话配音,就失去了特色;再比如,在美食介绍节目中,针对不同的菜系搭配当地的特色方言,更能引起人们的共鸣,想象中就能口齿生津。

以西南官话(四川)介绍美食:

西南官话(四川)音频:

https://ttspublic.blob.core.windows.net/nickzhao/sichuan.wav

重庆火锅以麻、辣、烫、鲜、香、嫩、脆著称,然而正宗的重庆火锅究竟应该烫啥子才巴适?鲜脆毛肚、爽滑鸭肠必不可少,富有嚼劲;剁椒嫩牛肉不可错过,双椒口感鲜辣十足;井水豆芽口感独特,石磨黑豆腐鲜香四溢,清爽荷心香甜解腻。

除了上述场景外,微软智能语音也已经在呼叫中心、新闻阅读等众多场景中应用。越来越多的企业对方言智能语音有需求,包括智能汽车、智能手机等企业对语音助理、呼叫中心的方言场景规划,以及(短)视频配音等等。

保护并传承传统文化,微软持续

致力于方言与诗歌智能语音的研究

汉语是世界上最古老的语言之一,受历史与地理条件的影响,出现了众多代表地域文化特色的方言。自 2017 年起,微软一直致力于 AI for Good 计划的推进,其中包括:通过提供前沿的技术、资源和专业知识,保护人文遗产以及创造更具可持续性和便利性的世界。微软也将持续投入于方言智能语音的研究,助力中国传统文化的保护与传承。

在方言之外,古典诗歌也是文化传承的重要载体。微软通过学习大量诗歌朗诵者的语音数据,可以让 AI 更好地表达诗歌的韵律、停顿、情感。微软可支持传统诗歌、现代诗歌、五言、七言律等智能语音的朗诵。 

中原官话(陕西)朗诵唐朝李世民的《守岁》:

中原官话(陕西)音频:

https://ttspublic.blob.core.windows.net/nickzhao/shousui-shaanxi.wav

《守岁》,唐,李世民。暮景斜芳殿,年华丽绮宫。寒辞去冬雪,暖带入春风。阶馥舒梅素,盘花卷烛红。共欢新故岁,迎送一宵中。

从智能家居到车载语音助手,从呼叫中心转写到多人会议记录,微软智能语音技术不断打破场景限制,让人工智能以各种各样的声音形象来丰富人们的工作和生活。未来,微软智能语音还将扩展覆盖更多全球语言和方言,持续提升模型质量、准确度,尽全力满足区域用户的个性化、差异化定制需求,为使用者提供更好的语音服务,解锁更多交互场景。

附:汉语方言通常分为十大方言:官话方言、晋方言、吴方言、闽方言、客家方言、粤方言、湘方言、赣方言、徽方言、平话土话。各方言区内又分布着若干次方言和许多种“土语”。其中使用人数最多的官话方言可分为东北官话、北京官话、冀鲁官话、胶辽官话、中原官话、兰银官话、江淮官话、西南官话八种次方言。

来源:中国语言文字概况(2021 年版)

http://www.moe.gov.cn/jyb_sjzl/wenzi/202108/t20210827_554992.html

 

 

阿里云产品-智能语音交互快速测评(代码片段)

...:可用于客服、阅读、虚拟人等场景易接入:并提供API和多种SDK识别准确率高:持续迭代提升响应速度快:低延迟,秒级处理返回语音识别结果二,产品在线使用2.1,开通产品服务首先,进入智能语音交互产品首页,单击开通并... 查看详情

ai语音对话技术

...以及自然语言处理技术的进步,开启了人与人工智能进行语音交互的可能,人们透过对话的方式获取信息、与机器进行交互,将不再只是存在科幻情结当中。语音交互是未来的方向,而智能音箱则是语音交互落地的第一代产品。... 查看详情

音箱语音交互技术,乐鑫esp32-h2芯片应用,无线wifi芯片模组

...网连接性的需求增加。伴随物联网的落地实现,智能语音交互的场景(如智能家居等)变得越来越多,而智能音频SoC芯片为智能终端设备的核心器件& 查看详情

转:it巨头纷纷“卡位”智能语音成人机交互入口必争之地

...sp;  随着物联网的迅速发展,作为重要接口的智能语音技术已成为国内外IT巨头的必争之地。上周,阿里推出了自己的首款智能音箱产品,百度宣布收购美国语音交互技术公司,而此前,亚马逊、谷歌、苹果、微软等硅谷... 查看详情

科大讯飞是题库出题还是本班老师出题

...型进行出题。科大讯飞股份有限公司是一家专业从事智能语音及语音技术研究、软件及芯片产品开发、语音信息服务的国家级骨干软件企业,语音技术实现了人机语音交互,使人与机器之间沟通变得像人与人沟通一样简单2023科... 查看详情

bixby的ai语音,能否推进人机交互进程?

文丨朱翊在输入法正式应用于人机交互方式之后,语音输入技术也逐渐成为整个业界关注的焦点。2011年苹果公司推出的Siri作为第一款智能手机语音交互技术,一定程度上为整个智能手机的语音交互趋势掀开了序幕,但Siri只能通... 查看详情

简单剖析智能语音交互技术

机器学习和自然语言处理技术的进步为语音与人工智能的交互提供了可能。人们可以通过对话获得信息,并与机器互动,而机器将不再只存在于科幻小说中。语音交互是未来的发展方向。智能扬声器是语音交互着陆的第一代产品... 查看详情

chatgpt-语音助手

第5章ChatGPT-语音助手5.1语音助手的定义与发展语音助手是一种能够通过语音识别和自然语言处理等技术,帮助人们完成各种任务和提供各种服务的人工智能系统。它们通常可以在智能手机、智能音箱、车载系统和家庭自动化系统... 查看详情

人工智能_智能家居:数据采集与数据标注

...也是我们感知AI落地最深的行业之一。智能家居产品融合语音控制、物联网技术,让我们生活更智能、给生活带来更多便利,目前主要应用场景如智能音箱、扫地机器人、智能电视等。1.智能家居数据采集覆盖智能家居主流应用... 查看详情

微软语音技术windows语音编程初步

...关的SR和SS引擎位于SpeechSDK开发包中。这个语音引擎支持多种语言的识别和朗读,包括英文、中文、日文等。SAPI包括以下组件对象(接口):(1)VoiceCommandsAPI。对应用程序进行控制,一般用于语音识别系统中。识别某个命令后... 查看详情

vivo手机中的语音唤醒啥意思

参考技术A你好,语音唤醒有时也称为关键词检测(Keywordspotting),也就是在连续不断的语音中将目标关键词检测出来,一般目标关键词的个数比较少(1~2个居多,特殊情况也可以扩展到更多的几个)。语音开关24小时不间断的检测... 查看详情

爆肝一周,用python在物联网设备上写了个智能语音助手-阿里云智能语音交互

基于HaaS云端一体框架,用Python打造HaaSEDUK1智能语音助手的过程中需要用到云端能力。本篇文章介绍如何开通阿里云智能语音交互,并创建配置语音识别及语音合成项目,获取Appkey。请参考《爆肝一周,用Python在物... 查看详情

wp8上的语音识别

WindowsPhone手机的Speech要比Siri更早学会通过语音启动应用程序的能力,更重要的是,微软在努力提供一种尽可能不用手去触摸、尽可能自然的应用内双向交互。例如视频中的语音控制电子书播放,甚至语音和一个应用程序进行对... 查看详情

haas云端一体智能语音交互方案

1、方案背景智能语音交互作为物联网领域的一个重要生态成员,是一种全新的交互方式,它能够解放双手,随时提供服务,无须借助任何按键。近年来智能家居逐渐走入千家万户,产业市场规模不断增长。智... 查看详情

华为机器学习服务语音识别功能,让应用绘“声”绘色

...在这些应用上,鼠标、键盘这样的交互方式不再便捷,而语音作为人类之间最自然的交流方式,语音识别技术俨然已成为各大应用的“标配”。语音识别场景应用十分广泛,如语音输入法、语音搜索、实时字幕、游戏娱乐、社交... 查看详情

搭建智能语音交互系统重要点那些

...市场开始蓬勃的发展起来了。简单介绍一下什么叫做智能语音交互平台。其实大实话就是在呼叫中心基础上,集成ASR、TTS、的呼叫服务平台。那么如何我们自己去搭建智能语音系统呢?我们先列出搭建智能外呼系统的搭建需要那... 查看详情

转:智能音箱产业深度分析,你的客厅进入语音唤醒时代

...015年,京东推出叮咚音箱,完成国内市场的从无到有。在语音交互技术发展的大背景下,智能音箱产品在提供内容娱乐、生活服务的同时,更多的接入到家庭生活场景中,成为智能家居的控制中心,以语音作为人口的物联网时代... 查看详情

华为机器学习服务语音识别功能,让应用绘“声”绘色

...用上,鼠标、键盘这样的交互方式不再便捷,而语音作为人类之间最自然的交流方式,语音识别技术俨然已成为各大应用的“标配”。语音识别场景应用十分广泛,如语音输入法、语音搜索、实时字幕、游戏娱乐... 查看详情