果然,武汉驶上了ai高速路

QbitAl QbitAl     2023-03-02     550

关键词:

博雯 明敏 发自 凹非寺
量子位 报道 | 公众号 QbitAI

要致富先修路。

在面向智能时代的转型中,武汉深谙此理。

这不,多模态人工智能产业联盟,为此而来。

中科院自动化研究所牵头,华为、武汉人工智能研究院提供技术支持。

再看其他联盟成员:武汉大学、华中科技大学、中移系统集成、爱奇艺、新华社技术局……都是产学研各界耳熟能详的名字。

它们聚集在武汉,搞了这个“大合体”的目的也很简单:

依靠和联盟成员的合作,要把多模态人工智能产业落地推进到底。

这是一个怎样的组织?

先从关键词解题。

模态”。这是一个认知领域的概念,指某种信息的来源或形式,或者“某件事情发生、被感知到的方式”。

人的触觉、听觉、视觉、嗅觉,作为信息媒介的语音、视频、图像、文字等都可以被称之为是一种模态。

多模态”一词则更多出现在计算机科学领域:当一个研究问题或数据集包含两种及其以上的模态数据类型时,它就被描述为多模态 (Multimodality)。


而通过多模态进行交互和学习,一度被称为是“最接近类人脑智能的方式”。

究其原因,还是人脑的感知和认知过程,本质也是一个多种感官信息融合处理的过程。

比如,人可以同时利用视觉和听觉信息理解说话人的情感:

因此,人工智能领域近几年的一个热门方向,就是学习不同模态信息之间的关联,处理和理解多模态信息。

并且,这些技术已经应用在了我们生活中的各个方面。

比如大家都熟知的自动驾驶技术,就是基于视觉摄像头、激光雷达、超声传感、地图等多种模态的传感器实现的:

还有一些视频网站的智能化推荐,也是通过分析视频封面、视频抽帧和文本几个模态的信息对视频质量进行评估:

此外,通过语音识别和视觉感知理解语义的智能音、结合产品图像和语义属性进行推荐的智能客服、融合人脸声音虹膜等多种信息进行身份识别的安全系统,都是多模态技术的体现。

所以多模态人工智能产业联盟会聚集各行各业的成员,也就再自然不过。

牵头的中科院自动化研究所,国内最早开展类脑智能研究的国立研究机构,拥有3个国家级重点平台和数十个重点实验室及研究中心。

今年9月份,中科院自动化研究所在华为全联接大会发布了全球首个三模态大模型紫东.太初。这一模型拥有千亿级别的参数,能够跨越视觉-文本-语音三种模态进行统一编码。

在今年的两项AI顶会,ACM Multimedia和ICCV的视频语义理解与视频描述赛道中,“紫东.太初”拿下两项冠军,在跨模态理解与生成性能上都展现出了目前业界的最高水准。

多模态联盟将基于紫东.太初,孵化更多行业应用,并进一步探索通用人工智能新路径。

联盟的理事长单位是中科院自动化研究所

另外三位副理事长,也是多模态领域的重要玩家。

他们分别来自华为爱奇艺武汉昇腾人工智能生态创新中心

其中,昇腾AI平台包括Atlas系列硬件、异构计算架构CANN、全场景AI框架昇思MindSpore、昇腾应用使能MindX以及AI应用使能ModelArts等,为开发者和企业高效使用AI能力,创新场景化AI应用,加速千行百业智能升级,可以说是目前业界极其领先的全场景AI平台。

爱奇艺也在多模态领域深耕多年。

依据自身的数据场景,爱奇艺构建了PPC视频-中文描述的数据集,基于这一数据集开发的跨模态搜索项目能够通过中文语句搜索视频中的内容。此外,还有能够基于视频内容自动生成语音解说的视频-台词-描述的跨模态模型。

此外,与其他AI生态组织中不同,多模态人工智能产业联盟当中,确实包含了诸多产业一线力量,通过完整名单,就能明显感知:

会员单位由湖南省马栏山计算媒体研究院、依瞳科技(深圳)有限公司、魏桥国科研究院、拓维信息股份有限公司、斗鱼、长江计算、武汉大学、华中科技大学、极目智能、武汉微创光电股份有限公司、武汉光庭信息技术股份有限公司、武汉兴图新科电子股份有限公司、武汉唯理科技有限公司、三峡电能能源管理(湖北)有限公司、普宙飞行器科技(深圳)有限公司、传神语构成。

在成立仪式现场,联盟成员也表达了目标和雄心。

希望从各自擅长的领域展开合作,通过这样一种产业聚合的模式,解决专用AI走向通用AI的挑战。

不仅是产学研融合,由于联盟成员几乎涉及到各行各业,AI创新成果也能及时落地到行业中,带来实际价值,并辐射到更广阔领域。

为什么是现在?为什么是武汉?

实际上,了解了“多模态”,也就知道并非新事物新概念。

于是问题也就来了——

那为什么多模态人工智能产业联盟的成立,会是现在?联盟基石“紫东.太初”是在武汉孵化?

个中缘由,其实包含了三方面。

因为这是在聚集了天时地利人和多方面因素、谋定而后动的一个成果。

首先来看天时——

多模态人工智能产业联盟的成立,是顺应AI发展的大势所趋的结果。

现下,AI发展的最大趋势是什么?

是从单点技术走向真正的通用技术、从单模态走向多模态、从大模型走向超大模型

单一算法的人工智能应用已逐渐不能满足应用需求,融合计算机视觉、自然语言理解、智能决策多方面能力的通用人工智能,开始大放异彩。

AI处理任务也不再只是收集单一信息,而是跨越图像、文字、语音、语义等多种模态,从中抽象出更高层的特征向量来解决问题。

以此同时,随着任务的复杂程度变高,算法模型的规模也在日渐扩大。

这些趋势上的变化,在应用层面上也早有显露。

比如AI最初的商用,在视觉和核验身份等方面,但现在,衣食住行用方方面面,都开始有AI渗透的影子。

背后原因,正是因为它在不断向多模态、通用性上靠拢。

而且这还可能只是开始的开始。

其次,地利,武汉的优势不言而喻。

作为长江经济带核心城市、中部崛起战略支点,国家对于武汉科技发展的重视程度可见一斑。

2020年9月,科技部正式发文批复,支持武汉建设国家新一代人工智能创新发展试验区。

不到一年时间,2021年5月31日,武汉人工智能计算中心正式竣工并投入运营,成为科技部批复的18个国家人工智能创新发展试验区中,最早落地的一个。

该人工智能计算中心,基于昇腾AI基础软硬件平台建设,在原来100P的基础上已扩容高达200P FLOPS

什么概念?

要知道,100P FLOPS就可相当于50万台电脑加起来的算力,每秒运算次数达百亿亿次

如此强悍的算力,一方面可以支持一个城市来运行许多重大AI项目,比如自动驾驶、智慧交通、智能制造、城市大脑等等。另一方面,作为智能时代的城市基础设施,也是支撑其他场景下AI落地的关键所在。

这也是为什么,在全国各大城市争相建设AI算力大型基建的背景下,武汉会抢占先机、拔得头筹,在人工智能计算中心的建设中,如此坚决果断。

当然,多模态人工智能产业联盟在武汉成立,也就顺利成章——毕竟计算中心已经有了,就意味着黑土地已经准备好了。

最后,人和

天时也好,地利也好,背后都是武汉自身对于发展AI、抓住智能时代发展机遇的渴求。

今年7月,武汉出台了《武汉国家新一代人工智能创新发展试验区建设若干政策》,提出8条激励措施,最高提供5亿元资金支持。

具体措施上,武汉开创了人工智能一中心四平台的“武汉模式”。

“中心”就是人工智能计算中心。

四大平台则是公共算力服务平台、应用创新孵化平台、产业聚集发展平台、科研创新和人才培养平台,主要面向千行百业。

目前,武汉已集聚超过500家人工智能企业,相关产业规模超过200亿元。预计2023年武汉AI核心产业规模将超过500亿元,带动相关产业规模超过5000亿元。

而发展之关键,不仅要有基础设施,还在于人才。

作为中国四大科教中心之一,武汉从来不缺人才,不然也不会“惟楚有才”。

而它现在进一步鼓励高校和龙头企业,做好产学研结合。例如创建人工智能重点实验室、研究院等创新科研组织,更是为了进一步培养关键科技人才。

加之这些年,武汉本身在科技产业发展上倾注了诸多心血。

比如吸引了华为、小米、联想等科技龙头企业落户,还打造了“光谷”这一高新技术发开区名片。

种种努力,桩桩件件,都是对智能时代机遇的志在必得。

如果说曾经,武汉和湖北,被质疑过“错失”互联网发展机遇,那么现在,AI时代大潮中,就得加倍补回来。

所以回过头来再看人工智能计算中心的建立、多模态人工智能产业联盟的成立,似乎都水到渠成,都是武汉要抓住AI机遇更快发展的努力和成果。

而剩下的问题,只有一个,武汉的干劲,用对地方了吗?

AI高速路上的武汉

时代级的机遇,往往成果也需要更长时间来等待。

但从大方向上,武汉的干劲,使在正确的方向上。

从AI发展维度来看,经历了技术研发、商用检验,现在正在进入产业场景下的大规模落地进程中。这种落地,深入各个场景,会与多元产业的方方面面结合,就像语音之于交互,视觉之于视频,覆盖到产业的方方面面。

所以“多模态人工智能产业联盟”因何成立,就是因为武汉看到了这种趋势而成立,说明武汉准确把握了AI发展的趋势,给产业发展提供了抢占先机的机会。

其次,从经济发展层面来说,都说AI是新动能,提供了新机遇,但如果能在发轫期就把机遇变成机制,产生飞轮效应,就能培养基础生态。

现在,“多模态人工智能产业联盟”就是这样的基础生态,它可以提供更多的需求、机遇和岗位。

一方面,可以最大限度留住武汉辈出的人才;另一方面,还能凭借各项人才政策,吸引更多优秀的人才前来,最终形成人才-产业生态-经济发展的正向循环。

最后,要致富先修路,AI时代也一样。

而AI时代的“高速路”、基础设施是什么?归根溯源,还是人工智能计算中心

武汉,正是准确预判了这种预判,在昇腾AI的加持下,各大一线城市在智能时代的竞速中,率先把握住了这种机遇。

于是九省通衢武汉,现在也是AI高速路上的武汉。

国外ai工程师讲述:深度学习与目标检测,理论和实践果然两码事

背景故事2018年,当时我在工厂实习,我开始研究目标检测技术,因为我需要解决视觉检测问题。这个问题需要在来自工业相机的图像流中检测许多不同的物体目标。为了应对这一挑战,我首先尝试将分类与滑窗法... 查看详情

谷歌在以色列的路口装上了ai红绿灯

导读:谷歌在近期发布的介绍可持续发展项目的博客和视频中,介绍了在以色列几个城市中安装了AI交通灯,是如何减少汽车空转造成的污染和能源消耗的,以及如何通过AI交通灯减少了路口的拥堵。作者:神... 查看详情

谷歌在以色列的路口装上了ai红绿灯

内容一览:谷歌在近期发布的介绍可持续发展项目的博客和视频中,介绍了在以色列几个城市中安装了AI交通灯,是如何减少汽车空转造成的污染和能源消耗的,以及如何通过AI交通灯减少了路口的拥堵。关键词&#x... 查看详情

公路病害检测有了“智慧眼”,思谋ai“助力”广东省高速公路

近日,思谋科技与广东省某高速企业达成合作,智慧交通一体化平台病害检测模块已成熟落地,将使广东省高速公路病害检测进入高频率、高效率、智能化时代,以行业领先的AI技术助力智慧交通产业的发展。近... 查看详情

53帧变900帧!ai让你不用昂贵的高速摄像机也能制作慢镜头,来自华为|cvpr2021...

...位报道|公众号QbitAI要制作慢动作视频就必须要用死贵的高速摄像机?NO!可以用AI。看到没,这就是AI完成的效果!虽然和真正的高速摄像机至少上千的帧数没法比,但它完全可以做到每秒53帧的视频轻轻松松变成960... 查看详情

emc:专业的人做专业的事vxrail助中通业务创新驶上“快车道”

客户证言:“与传统IT基础架构相比,超融合方案最大的优势是灵活、便捷。长期以来,运维复杂度一直是快递业核心业务系统面临的一大难题,超融合提供了更轻松、简便的运维管理途径。中通集团此次在快运业务中选择与EMC... 查看详情

deeplearning.ai人工智能行业大师访谈andrejkarpathy听课笔记

...上训练受限玻尔兹曼机,觉得很有趣。后来在UBC读硕士,上了另一门机器学习的课,那是他第一次深入了解神经网络的相关知识。他对人工智能很感兴趣,上了很多相关的课,但是对那些知识听不太懂,不是非常满意。他觉得神... 查看详情

公路大修中的沥青路面就地热再生技术运用李开明方芳武汉江夏路桥工程总公司

...  李开明 方芳       武汉江夏路桥工程总公司        湖北武汉     430207       摘要:高速公路沥青路面工程在使用的过... 查看详情

果然,chatgpt还是被拿去搞黄色了...(代码片段)

👇👇关注后回复 “进群” ,拉你进程序员交流群👇👇来源:网络此前,推出的各类AI绘画工具。想要制作出还能看得过去的作品,需要一定的美术功底和美感,上手门槛一点也不低。大部... 查看详情

oracle应用也能跑在azure上了!微软、甲骨文签定云互通协议

参考技术A在许多业务上水火不容的微软与甲骨文周三宣布云端互通的合作协议,让彼此的用户能无碍在MicrosoftAzure和OracleCloud两个环境下搬移资料和作业,企业客户甚至能将OracleERP及底层OracleDatabase分别跑在Azure及OracleCloud上。双... 查看详情

jzyzoj1527[haoi2012]高速公路线段树期望

...tp://172.20.6.3/Problem_Show.asp?id=1527日常线段树的pushdown写挂,果然每次写都想得不全面,以后要注意啊……求期望部分也不熟练,和平均数搞混也是orz,我已经是个期望都求不出来的废人了。这道题显然(大概)每个段的贡献是val[i]... 查看详情

当你老了,ai养你

...,在全球人口老龄化的危机下,AI+养老也顺理成章地被提上了日程。与其他AI+内容相比,老人群体又有着较为鲜明的特征。对其而言,身体机能的逐步下降令其对科技产品的生活辅助功能要求较高,同时也必须要顾及到随时可能... 查看详情

人工智能ai

...,银行,VR、AR,辅助驾驶阶段都按照书中的预测进入了高速发展并成熟落地阶段,人工智能+大数据处理,使得人工智能在智能问答机器人,新闻搜索与推送,机器翻译,机器视觉等方面也是百花齐放。人工智能的高速发展,迫... 查看详情

不可复制的ai螺旋:huaweip20的“长板理论”

...象都在告诉消费者,需要对HUAWEIP20系列抱以更多的期待。果然,DxOMark排名登顶、徕卡三摄、AI摄影大师等等关键词的出现,标志着HUAWEIP20要在P系列把摄影和AI两棵技能树通通点满。如今HUAW 查看详情

昇腾ai新技能,还能预防猪生病?

摘要:日前,由华为与武汉伯生科技基于昇腾AI合作研发的“思符(SiFold)蛋白质结构预测平台”正式推出,并成功应用于国药集团动物保健股份有限公司的猪圆环病毒疫苗研发中。本文分享自华为云社区《昇... 查看详情

百度智能云可编程网关技术升级,为ai原生云打造10t级高速智能云网络

随着数字化转型和智能化升级的加速,更多的企业级应用开始基于多云、混合云、边缘云等新模式构建,比如自动驾驶、车路协同、物联网、电商、视频、游戏等。这些应用对网络提出了更高的要求,尤其是对云网关... 查看详情

百度智能云可编程网关技术升级,为ai原生云打造10t级高速智能云网络

随着数字化转型和智能化升级的加速,更多的企业级应用开始基于多云、混合云、边缘云等新模式构建,比如自动驾驶、车路协同、物联网、电商、视频、游戏等。这些应用对网络提出了更高的要求,尤其是对云网关... 查看详情

英伟达秀全球最大gpu,黄仁勋从烤箱里拿出的产品果然「爆了」

...播放了黄仁勋在自家厨房里录制的视频完成了新品发布。果然是手里有「硬货」就不在乎形式了。英伟达的首款安培架构GPU可以算「史上最强」了,基于7nm工艺制程,拥有540亿晶体管,面积为826mm²,与Volta架构相比性能提升... 查看详情