华为机器学习服务语音识别功能,让应用绘“声”绘色

HMSCore技术团队 HMSCore技术团队     2022-11-28     408

关键词:

随着人们对生活的仪式感的追求,移动设备、可穿戴设备、智能家居设备、车载信息娱乐系统也变得越来越流行。在这些应用上,鼠标、键盘这样的交互方式不再便捷,而语音作为人类之间最自然的交流方式,语音识别技术俨然已成为各大应用的“标配”。语音识别场景应用十分广泛,如语音输入法、语音搜索、实时字幕、游戏娱乐、社交聊天、人机交互、驾驶模式等。因此,App里集成语音识别功能不仅能解放双手,也能得到很好的人机交互体验。


1. 业务简介

HMS Core​​机器学习服务​​支持将实时输入的短语音(时长不超过60秒)转换为文本,可实时识别60秒内的语音。该服务使用行业领先的深度学习技术,随着算法和数据的不断迭代,目前在通用理想环境下的识别准确率可达95%以上。目前支持中文普通话(包括中英文混说)、英语、法语、德语、西班牙语、意大利语、阿拉伯语、俄语、泰语、马来语、菲律宾语的识别。

华为机器学习服务语音识别功能,让应用绘“声”绘色_机器学习

DEMO演示华为机器学习服务语音识别功能,让应用绘“声”绘色_机器学习_02

2 . 场景介绍

HMS Core​​机器学习服务​​覆盖日常生活及工作中的众多领域,并且深度优化了购物搜索、影视搜索、音乐搜索以及导航等场景中的识别能力,进一步提高这几类场景的识别准确率。在使用购物类App搜索商品时,可以将语音描述的商品名称或特征识别为文字从而搜索到目标商品。同样,在使用音乐类App时,可以将语音输入的歌名或歌手识别为文字进而搜索歌曲。另外,司机在驾驶过程中不方便输入文字时,可以将输入的语音转换为文字继而搜索目的地,让行车更加安全。


3 . 功能特点

• 支持实时出字 • 提供拾音界面、无拾音界面两种方式 • 支持端点检测,可准确定位开始和结束点 • 支持静音检测,语音中未说话部分不发送语音包 • 支持数字格式的智能转换,例如语音输入“二零二零年”时,能够智能识别为“2020年”。 如何接入华为机器学习服务? 华为​​机器学习服务官网​​。

了解更多详情>>

访问​​华为开发者联盟官网​

获取​​开发指导文档​

华为移动服务开源仓库地址:​​GitHub​

关注我们,第一时间了解 HMS Core 最新技术资讯~

hmscore机器学习服务打造同传翻译新“声”态,ai让国际交流更顺畅

2022年6月,HMSCore机器学习服务面向开发者提供一项全新的开放能力——同声传译,通过AI语音技术减少资源成本,加强沟通交流,旨在帮助开发者制作丰富多样的同声传译应用。HMSCore同声传译涵盖了机器学习服务... 查看详情

ai改变千行万业,开发者如何投身ai语音新“声”态

...验AI已经成为IT技术厂商需要重点打造的能力,例如在华为提供端、云开放能力服务的HMSCore中,重点为开发者打造了MLKit机器学习服务,覆盖了文本类、语音语言类 查看详情

华为机器学习服务银行卡识别功能,一键实现银行卡识别与绑定

...作程序已经成为提升企业竞争力的重要手段。因此,使用华为​​机器学习服务​​,就能很好的解决这一问题。1. 业务简介HMSCore​​机器学习服务​​银行卡识别服务是 查看详情

华为机器学习服务银行卡识别功能,一键实现银行卡识别与绑定

...序已经成为提升企业竞争力的重要手段。因此,使用华为机器学习服务银行卡识别功能, 查看详情

华为机器学习服务活体检测再升级,构建安全友好的交互式体验

...的同时,“假脸”安全风险也逐渐显现。目前,华为机器学习服务(MLKit)的活体检测服务日活调用量较高,其辨别人脸真伪的能力精准触达了用户的核心诉求,引起广大开发者共鸣。为了使人脸识别变得... 查看详情

华为机器学习服务活体检测再升级,构建安全友好的交互式体验

...的同时,“假脸”安全风险也逐渐显现。目前,华为机器学习服务(MLKit)的活体检测服务日活调用量较高,其辨别人脸真伪的能力精准触达了用户的核心诉求,引起广大开发者共鸣。为了使人脸识别变得... 查看详情

解锁普惠ai开发,华为云modelarts一站式ai开发平台

解锁普惠AI开发,华为云ModelArts一站式AI开发平台一、ModelArts服务简介:ModelArts是面向AI开发者的一站式开发平台,提供海量数据预处理及半自动化标注、大规模分布式训练、自动化模型生成及端-边-云模型按需部署能力,帮助用... 查看详情

手语也能机器翻译了!机器学习手势识别功能了解一下(代码片段)

华为机器学习(MLKit)提供手部关键点识别服务,可用于手语识别。手部关键点识别服务能识别手部21个关键点,通过每个手指的方向和手语规则作比较去找手语字母表。应用场景手语通常被听力和口语有障碍的人... 查看详情

机器学习服务文本翻译能力升级,中文直译模型让译文表达更地道!

HMSCore机器学习服务文本翻译能力提供多种语言和多种应用场景的翻译服务,比如,在出国旅游的场景中,用户可以借助应用的语音翻译播报功能在打车、酒店入住等场景中无障碍沟通,也可以通过拍照翻译功能读... 查看详情

ros:语音识别与合成,让机器人会说话

智能机器人当然少不了语音功能,这篇文章将介绍一下ROS中的语音识别与合成。参考《rosbyexample》。准备工作1.运行以下命令:sudoapt-getinstallgstreamer0.10-pocketsphinxsudoapt-getinstallros-indigo-pocketsphinxsudoapt-getinstallros-indigo-audio-commonsudoapt 查看详情

机器学习

定义:从广义上来说,机器学习是一种能够赋予机器学习的能力以此让它完成直接编程无法完成的功能的方法。但从实践的意义上来说,机器学习是一种通过利用数据,训练出模型,然后使用模型预测的一种方法。机器学习所牵... 查看详情

手语也能机器翻译了!机器学习手势识别功能了解一下(代码片段)

华为机器学习(MLKit)提供手部关键点识别服务,可用于手语识别。手部关键点识别服务能识别手部21个关键点,通过每个手指的方向和手语规则作比较去找手语字母表。应用场景手语通常被听力和口语有障碍的人... 查看详情

alexaminifn功能

AlexaMiniFN是一款高性能小型AI模型。它利用基于机器学习的技术,将计算机视觉技术与语音技术相结合,使用者可以通过语音指令来控制机器人,完成诸如识别物体、语音识别、自然语言理解等多种计算机视觉任务。它还可以用... 查看详情

基于机器学习的语音编解码器声网agorasilver:支持超低码率下的高音质语音互动

...来改进语音通话体验。我们现在在国内率先正式推出基于机器学习的语音编解码器(语音AICodec&# 查看详情

语音识别玩转语音识别1语音识别简介

...助我们跨越语言的鸿沟,实现不同语言间的翻译销售:语音机器人可以帮助我们确定客服的基本需求,提高销售效率 查看详情

什么提供机器人应用设计功能

参考技术A机器人应用可以由不同的软件和硬件组成,提供不同的设计和功能。以下是一些常见的机器人应用设计和功能:机器视觉:机器人可以使用摄像头和其他传感器来获取和处理图像和视频数据。这项技术可以用于自动化... 查看详情

tensorflow入门——3解决问题——4让我们开始吧

深度学习适合解决海量数据和复杂问题在机器学习中,语音识别,图像识别,语意识别用的是不同的技术,从事相关工作的人合作几乎不可能。深度学习改变了这一切。80年代计算机很慢,数据集很小,因此深度学习没有得到广... 查看详情

集成华为机器学习服务(mlkit)轻松打造爆款小游戏(代码片段)

...霸屏朋友圈。你是否也想做出一款爆款有趣的小游戏呢?华为机器学习服务提供的人脸识检测、手部关键点识别功能可以帮助你实现。CrazyRockets——这款游戏集成人脸识检测、手部关键点识别功能。开发出两种玩法,一种是通过... 查看详情