科大讯飞全球1024开发者节:多模感知深度理解多维表达运动智能

CSDN资讯 CSDN资讯     2022-12-14     132

关键词:

2022 科大讯飞全球 1024 开发者节拉开帷幕。在经历了一天的闭门论坛和应用赛路演之后,11 月 18 日,“AI 向新·数智万物”主发布会正式开启。

开幕式当天,众多院士学者、产业领袖、行业知名专家与生态开发者云集,共同探讨人工智能技术的最新进展和应用前景。从源头技术创新,到平台产品升级;从产业数字化转型,到用人工智能解决社会刚需命题。

面对世界的各种不确定性,中国乃至全球经济下一步发展的主要动力来源在哪里?1024开发者节开幕式上,科大讯飞董事长刘庆峰分享了自己的见解。

会上,科大讯飞董事长刘庆峰首先带来“因为看见,所以坚信”的主题演讲。在他看来,新兴产业发展最核心的要素不是概念,也不是纯粹的技术创新,而是洞察未来社会发展的刚需。“以刚需加代差形成中国人工智能产业在全球的群体优势。”

数字经济是全球经济复苏的关键动力,人工智能是数字经济的核心引擎。可以看到,2021年全球47个国家数字经济增长达15.6%。今年的AI开发者大赛有32333支团队参赛,工业互联网方向参赛团队数10605个,虚拟现实、元宇宙方向参赛团队数1268个,算法前三名团队平均年龄25.6岁,一系列数据表明,虚拟现实、工业互联网、元宇宙大潮兴起、Z世代正成为AI开发者的主角。

在关键性的技术进展上,多模感知、深度理解、多维表达、运动智能是近一年来的主要发展方向。持续赋能教育、医疗、元宇宙、机器人等领域。基于核心技术的进步,刘庆峰表示讯飞即将发布机器人超脑,通过多模交互、运动控制和硬件模组的结合,推动人机协同新时代。

刘庆峰指出,要通过源头技术创新、系统性创新和生态定义未来。洞察未来最好的方式就是创造未来。在我们的共同努力下,人工智能必将以解决人类刚需而被深刻地载入史册。

开放平台2.0稳步推进,加快数实融合

在1024计划发布会上,围绕技术创新和行业应用,科大讯飞总裁吴晓如重点分享了讯飞开放平台2.0的最新进展。

据了解,该平台已开放能力达513项,集聚370万开发者,在教育、金融、医疗、能源、地产等14个行业取得应用落地,与金茂地产、古井集团、建设银行、国能集团等数十家行业龙头达成战略合作。

“技术顶天,应用落地”。过去一年,在语音、图像和认知的国际高水平技术评测中,科大讯飞共获得12项比赛冠军;多模感知、交互大脑、多维表达、运动智能深度融合。

未来,开放平台要继续升级,需把握四个关键点:为实体和虚拟经济提供更强大的AI能力、场景智能需要有更高效地运用行业知识、人机协同需要人能更高效地使用AI工具、AI使用的便捷性和隐私保护及数据安全。超脑2030将提供更多优化的AI能力,为生态伙伴打造更强大的人工智能开放平台。

发布会上,吴晓如还介绍了讯飞AI虚拟人交互平台的发展情况。具备多模感知、多维表达、情感贯穿、自主定义四大核心特点的AI虚拟人交互平台,已在媒体、金融、文旅、政企等场景落地,为上千家客户提供服务。同时,借助AI虚拟人交互平台,讯飞与合作伙伴共同推进虚拟人的繁荣发展,为数字经济和元宇宙的发展提供助力。

AI新技术发布,开启AI新纪元

2022年初,讯飞宣布启动超脑2030计划,致力于让人工智能懂知识、善学习、能进化,让AI机器人走进每个家庭。AI新技术发布会上,科大讯飞AI研究院副院长高建清分享了讯飞为实现超脑2030计划,开展的一系列技术突破,包括:以深度学习为代表的人工智能基础算法;复杂场景的语音、情感、环境等多模态感知技术;深度理解、主动对话、可控对话生成等关键的认知智能技术;软件硬一体的机器人关键技术。

技术推动下,超脑2030计划已结硕果,形成多个示范应用。基于多模态交互、以及医疗认知技术,讯飞研发了抑郁定量筛查系统,该系统已在北京安定医院、合肥四院等医院试点应用,抑郁筛查效果由75%提高至91%。未来,基于定量筛查基础能力,讯飞将研发抑郁症筛查平台,向更多的学校推广,助力青少年的心理成长;由客服虚拟人、招聘虚拟人、服务虚拟人、法务虚拟人、助力虚拟人组成的专业虚拟人家族,专业知识可定制、持续进化有温度,已为上千家企业提供高效数字化服务;为了探索面向未来元宇宙更好的人机交互体验,讯飞还打造了一套高沉浸人机交互系统。

翻译、多语种、图文图像、AI+医疗、AI+教育,讯飞的众多核心技术也在持续优化和突破。以多语种为例,基于多语种自适应混合预训练框架,语音识别各语种效果平均提升20%;完成了60个语种的语音识别、语音合成、机器翻译等技术研发,14个重点语种达到国际领跑水平。

在超脑2030计划及更多系统性技术创新的牵引下,讯飞的AI科技树正茁壮成长。未来,讯飞将继续以源头创新引领技术突破,以产业目标牵引技术发展、用开放生态促进生态繁荣。

平台新产品发布 携手迈入人机协同新时代

过去一年,人工智能产业表现出了蓬勃旺盛的生命力。讯飞开放平台开放AI能力和生态合作伙伴不断增长,社交、居家、出行、学习、办公、阅读等领域AI能力的调用数持续提升,人工智能在人机交互阶段已经深入到人类生产和生活的方方面面,并在各自的领域中发挥着重大的作用。但目前人机交互仍存在不少问题,人工智能正在亟需从当前的机器被动交互走向与人高效协同的时代,以机器人为载体的智能一体化应用将迎来广阔的发展空间。

科大讯飞消费者事业群总裁于继栋表示,为全面赋能人机协同场景,讯飞开放平台进行了全新升级。依托感知智能、认知智能和运动智能的强大技术底座,围绕能力赋能、智能交互、数字资产、模型训练、自动化和机器人超脑构建,以API、低代码、软硬件一体和解决方案的方式,面向实体机器人和虚拟数字人建设N种场景化机器人,赋能工业、农业、服务业、能源行业等,连接产业生态,共建行业场景。

全新升级的讯飞开放平台中,机器人超脑AIBOT值得特别注意。机器人超脑AIBOT通过多模交互、深度理解、运动控制和硬件模组的结合,能够帮助开发者快速构建机器人运动能力。

目前,升级后的讯飞开放平台已在实体机器人和虚拟数字人领域有了实际的落地应用。在实体机器人方面,讯飞联合宇树科技推出了支持户外巡检、化工巡检等多元场景巡检的四足机器人;联合珞石机器人推出了柔性机械臂实现与人更安全的配合,可用于工业巡检、商业服务等场景;虚拟数字人方面,数字机器人助力企业构建协作新模式,虚拟人资产进一步扩充,星昼数字藏品为品牌客户打造了可交互的数字资产。

让每个创新者享受AI乐趣,开发者灯塔计划也在发布会上正式发布。此计划面向技术开发者、业务开发者、创新开发者以及千行百业的开发者,提供行业场景赋能、技术赋能、品牌合作背书、实验室合作等支持,打造共生、共创、共享、多样繁荣的开发者生态,携手迈入人机协同新时代。

新技术、新产品发布之外,大会现场,鄂维南院士分享了下一代人工智能方向和可能性的思考;潘建伟院士带我们一起走进量子力学的神秘世界;图灵奖获得者 、欧洲科学院院士约瑟夫·斯发基斯详细解释了为何建立可信的自主系统是迈向通用人工智能的一大步;中国上市公司协会会长宋志平分享了对企业创新方向的深度见解;中国电子信息产业发展研究院院长张立发布了中国人工智能创新发展指数。

saas,会成为科大讯飞的新增长极吗?

...的一举一动备受投资者和从业者们关注。在科大讯飞1024开发者大会上,科大讯飞一口气推出多款SaaS产品,引发市场热议。在根据地业务保持稳健增长的基础下,科大讯飞正试图加速将AI技术带到更多消 查看详情

克隆真人语音只要1句话,ai问诊超96.4%全科医生!科大讯飞年度黑科技大秀,余承东都来了...

...净萧箫发自凹非寺量子位报道|公众号QbitAI企业拥有265万开发者是一种什么体验?是在最新财报上已经商业变现,开放平台营收增速高达131%?是连续5年在合肥振臂一呼,全球就迅速响应?当然,这还不是全... 查看详情

科大讯飞是题库出题还是本班老师出题

科大讯飞是题库出题,有专门的题库,针对不同的考试类型进行出题。科大讯飞股份有限公司是一家专业从事智能语音及语音技术研究、软件及芯片产品开发、语音信息服务的国家级骨干软件企业,语音技术实现了人机语音交互... 查看详情

uniapp-接入科大讯飞语音评测(代码片段)

...持中文和英文。最新的流式版使用webSocket调用接口,开发者可以边录音边上边音频数据(录音与评测同时进行),可以缩短用户等待 查看详情

uniapp-接入科大讯飞语音评测(代码片段)

...持中文和英文。最新的流式版使用webSocket调用接口,开发者可以边录音边上边音频数据(录音与评测同时进行),可以缩短用户等待 查看详情

uniapp-接入科大讯飞语音评测(代码片段)

...持中文和英文。最新的流式版使用webSocket调用接口,开发者可以边录音边上边音频数据(录音与评测同时进行),可以缩短用户等待 查看详情

2022科大讯飞ai开发者大赛,来了!

目录1、计算机视觉方向1.1、基于深度学习的小样本视频手势识别1.2、稀疏角度CT投影重建挑战赛1.3、X光安检图像检测挑战赛3.01.4、LED灯的色彩和均匀性检测挑战赛1.5、智能硬件语音控制的时频图分类挑战赛2.01.6、高分辨率遥感... 查看详情

2022科大讯飞ai开发者大赛,来了!

目录1、计算机视觉方向1.1、基于深度学习的小样本视频手势识别1.2、稀疏角度CT投影重建挑战赛1.3、X光安检图像检测挑战赛3.01.4、LED灯的色彩和均匀性检测挑战赛1.5、智能硬件语音控制的时频图分类挑战赛2.01.6、高分辨率遥感... 查看详情

科大讯飞刘聪:由chatgpt浪潮引发的深入思考与落地展望

...心技术的聊天机器人ChatGPT火爆全球。百度、阿里巴巴、科大讯飞、360等国内企业纷纷抛出ChatGPT相关进展,打造中国版的ChatGPT。科大讯飞此前在投资者互动平台表示,ChatGPT主要涉及到自然语言处理相关技术,属于认... 查看详情

第17届科大讯飞杯i-纸牌(循环节思维)(代码片段)

题目:传送门题意  思路对于k<=n-1的情况,我们可以将全部的牌隔一个位存起来,也就是起初的时候,第i张牌,放在b[2*i-1]的位置。每次操作将第i张牌放到第(i-1)%(n-1)+2=i+1的位置的下一位,即放到b[2*(i+1)]的位置。因为... 查看详情

都要2023年了,造机器人还能搞出什么新花活?

...个新玩家。以AI知名的科技公司科大讯飞,2022全球1024开发者节上官宣最新技术成果和进展。其中之一,就是“AI+四足机器人”项目,机器狗:小黑。没错,科大讯飞也决定拥有一只机器狗,还是很新的... 查看详情

人工智能之自然语言处理技术总结与展望

...究与应用。曾获得阿里云天池安全恶意程序检测第一名,科大讯飞恶意软件分类挑战赛第三名,CCF恶意软件家族分类第四名,科大讯飞阿尔茨海默综合症预测挑战赛第四名,科大讯飞事件抽取挑战赛第七名,Datacon大数据安全分... 查看详情

uniapp-接入科大讯飞语音评测(代码片段)

...持中文和英文。最新的流式版使用webSocket调用接口,开发者可以边录音边上边音频数据(录音与评测同时进行),可以缩短用户等待评测结果的时间,大大提高用户体验。语音评测官方介绍:https://www.xfyun.... 查看详情

科大讯飞aiui

一直对语音机器人很感兴趣的我,在看到科大讯飞新发布的AIUI还是忍不住购买了评估版,进行测试和体验。AIUI评估板搭载科大讯飞最新的人机智能交互解决方案。通过简单的连接和配置即可进行体验。确实是十分容易上手。&nbs... 查看详情

《人月神话》作者去世;英特尔推出假脸识别神器fakecatcher;1350万核ai超级计算机将问世|ai一周快讯...

...#xff0c;AI产业界有哪些大事件?产业界科大讯飞1024线下开发者节主会开启,鄂维南、潘建伟演讲2022科大讯飞全球1024开发者节拉开帷幕。在经历了一天的闭门论坛和应用赛路演之后,11月18日,“AI向新·数智万物”... 查看详情

如何开发一个在线朗读的功能----科大讯飞语音合成实战(代码片段)

...是开始撸码。https://www.xfyun.cn/doc/tts/online_tts/API.html注册为开发者,接口要求这些我就不赘述了,文档里面写的清楚。当然具体实现是另外一回事。听了一下效果,怎么说呢,免费的和特色的还是有很大的差别的,免费的是刚好让... 查看详情

2021年科大讯飞基于脑电的情绪识别前三名队伍分享

文章目录1.第一名AI_health1.1团队介绍1.2算法方案解析1.2.1数据处理1.2.2模型设计思路1.2.3模型设计1.2.4结果1.3优化思路2.第二名虚拟革命战队2.1团队介绍2.2任务介绍2.3方案2.3.1数据预处理2.3.2深度学习架构2.3.2.1编码器 查看详情

第17届科大讯飞杯i-纸牌(循环节思维)(代码片段)

题目:传送门题意  思路对于k<=n-1的情况,我们可以将全部的牌隔一个位存起来,也就是起初的时候,第i张牌,放在b[2*i-1]的位置。每次操作将第i张牌放到第(i-1)%(n-1)+2=i+1的位置的下一位,即放到b[2*(i+1)]的位置。因为... 查看详情