张亚勤:未来10年ai+生物制药大有可为,我们正开展破壁计划|meet2022

QbitAl QbitAl     2023-03-02     138

关键词:

编辑部 发自 凹非寺
量子位 报道 | 公众号 QbitAI

都说“21世纪是生物的世纪”。

那么,去年谷歌DeepMind推出的AlphaFold 2,无疑将当下的AI技术与尚在探索的生物技术完美结合起来。

其实不仅在国外,国内一批顶尖人才和有识之士也在探索这两项技术的融合

曾经活跃在产业界,如今回归学界张亚勤院士,就在努力促成AI推动生命科学的发展。

去年,张亚勤从百度离开加入清华大学,成立清华智能产业研究院AIR。如今,短短一年,已有多名世界顶级科学家加盟AIR。

在MEET2022智能未来大会上,张亚勤透露清华智能产业研究院在进行的重要科研项目之一,就是利用AI技术开发抗体、研究DNA序列、预测蛋白质结构等等。

张亚勤认为,AI在新冠疫苗的研发过程中发挥了重要作用,堪称AI在生命科学实际应用中的重大事件:

去年年底疫苗进入临床实验,今年开始大规模使用,不管是灭活疫苗,还是mRNA疫苗,这可能是人类历史上最快的一次用人工智能加速疫苗开发的例子。

为了完整体现张亚勤院士对AI技术与生命科学关系的思考,量子位在不改变原意的基础上,对他的演讲内容进行了编辑整理。

演讲要点

  • 清华大学智能产业研究院(AIR)使命是利用人工智能技术赋能产业升级,推动社会进步。

  • 我们首先是经历内容数字化,后来到企业数字化,现在进入物理世界的数字化,和生物世界的数字化。我们的身体、大脑、器官、细胞、蛋白质和基因等都在数字化。

  • 人工智能和生命科学方面尽管有很多可以合作的地方,但是也有很多壁垒,两个行业是两类不同的语言体系,两类不同的科学家,很重要的是怎么样能把这两个行业无缝连接起来。

  • 我们现在整个生物世界在走向数字化、自动化,也包括智能的科学计算,像分子动力学,薛定谔方程等,都会和AI相辅相成。

(以下为张亚勤演讲全文)

清华智能产业研究院的使命

我特别喜欢今天这个主题:因为看见,所以相信。这个世界属于对未来有期待,有理想甚至幻想的人们。预测未来最好的方式,就是去创造未来。

人工智能经过60多年的发展,正是因为最初从事人工智能科研的科学家对这个行业有信心、有洞察力,才迎来今天的爆发,使得人工智能成为通用的技术,成为无所不在的赋能技术,就像空气AIR。

今天我主要讲人工智能赋能生命科学。

我简单介绍一下清华大学智能产业研究院(AIR),这是去年我离开百度之后创立的研究院。这里的I有三重含义,AI、International国际化、及Industry产业。AIR的使命是人工智能技术赋能产业升级,推动社会进步。

人工智能是第四次工业革命的决定性技术,我们希望打造面向第四次工业革命的国际化、智能化和产业化的研究机构。

AIR的战略目标有三个:

  • 首先要培养人才,主要是具有国际视野的顶级架构师、未来的CTO;

  • 第二是实现核心的技术突破;

  • 第三是是希望AIR研发的技术能用到产业,给产业带来重大的影响。

就在明天,清华大学智能产业研究院(AIR)将迎来一岁生日。

这一年来,AIR非常幸运的邀请到多位世界顶级科学家,并且这些教授学者们都有双重经历:一方面有很深的学术造诣,另一方面又有丰富的产业背景。

我们选择了三个方向作为突破点:第一个是智慧交通,第二智慧物联IoT,第三智慧医疗。重要的还是ABCD(AI、大数据、云计算、设备)四个横向的技术领域作为基石。

今天我重点讲一下AI+生命科学方面的一些进展。整个信息产业,过去三十年最大的突破就是数字化。

AI带来生物数字化

首先是内容数字化,后来到企业数字化,现在进入物理世界的数字化和生物世界的数字化,我们的身体、大脑、器官、细胞、蛋白质和基因等都在数字化。另一方面人工智能、算法和算力系统快速进展使得大量的数据有使用的场景。

同时人工智能也推动生物实验的自动化。

正如刚才量子位创始人李根先生所说,目前人工智能算法取得很多进展,我们有巨量的模型,在国内比如鹏城的盘古、智源的悟道、浪潮的源1.0,国际有GPT-3、微软和AMD联合推出的Megatron-Turing,包括马上将会出现的GBT-4,整个量越来越大。

同时,AI也在极大加速生命健康和生物医药领域的快速发展。

以新药研发为例,目前要开发一种新药需要投入超过十几年的周期,花费数十亿美元,周期很长、费用极高。这样巨大的投入显然会对医药行业带来巨大瓶颈,AI正在改变这种状况。

首先在基因编辑方面,AI+CRISPR可以更精准,更快的找到靶点。

另外,在大分子、抗体,以及TCR个性化疫苗和药物,还有最近AlphaFold在蛋白质三维结构解析方面的新进展,从序列到结构到功能,AI技术功不可没。

我们最近在研究的课题之一,就是怎样使高通量的生物实验自动化,把干实验和湿实验无缝连接起来,形成闭环,真正地加速整个制药和生命科学的发展。

在这点上一个非常形象的例子就是新冠疫苗的开发周期大幅度缩减。中国科学家在新冠病毒出现之后的第一时间,2020年1月份就找到了病毒基因的序列,三个月之后,蛋白质的结构就被解析出来了,此后一个月,病毒和人的交互的方式也解析出来了,去年底疫苗进入临床实验,今年开始大规模使用,不管是灭活疫苗,还是mRNA疫苗,这可能是人类历史上最快的一次用人工智能加速疫苗开发的例子。

另外,AIR彭健教授将迁移学习模型用做药物临床前的评估,和精准临床实验的设计。我们知道人类很多疾病样本数据很少,但却积累了很多动物数据,用动物数据模型加上目前已有的人类肿瘤细胞系上的药物数据,运用可解释型的机器学习能很快迁移到人体内的药效预测任务上。从结果可以看到,彭健教授这种迁移学习方式对于三阴型乳腺癌患者设计的药物医药可信度提高5倍左右。

另外,彭健教授团队还把几何深度学习用到AI抗体的开发。目前虽然蛋白质序列大幅度被解析出来了,但是其本身的形状几何结构还有很多的变化,他们想做的就是把蛋白质表面的几何表征用深度学习方法去表示出来,然后做抗体亲和力预测。

彭健教授最近也取得了一些新的进展,他创建的Helixon公司与清华大学医学院一起合作研发出全球首个AI设计的新冠抗体,这其实是一种新范式。病毒本身是一直在变化的,但通过综合分析抗体与抗原的相互作用,有效设计抗体可变区氨基酸序列,这样的抗体本身也是相对比较稳定,且对德尔塔、阿尔法、伽玛等突变株具有高效和广谱的病毒中和效果。

另外,AIR兰艳艳教授也带领的学生在基因测序方面做了很多新的工作,并在今年的创新工场Deecamp竞赛中获得了冠军。我们已知基因10%是编码的,90%是未编码的,他们利用基因里的未编码部分,将这些数据用前沿的预训练技术构造了一个全新的模态。

人工智能和生命科学领域尽管有很多可以合作的地方,但是也有很多壁垒,两个行业是两类不同的语言体系,两类不同的科学家,如何把这两个行业无缝连接起来很关键。AIR提出的AI+生命科学破壁计划就是希望能跨越两个学科的鸿沟。同一张图AI科学家看到的是各种不同的神经网络、算法模型;生命科学家看到则是蛋白质、细胞,以及各种生物结构功能。所以怎样抽象出哪些问题,以及如何利用这些数据,是一个亟待解决的问题。

AI赋能生命健康领域包括三个层次:AI基础设施建设、数据平台搭建,以及AI算法引擎设计。

最好的人工智能赋能生命科学的例子就是蛋白质预测模型AlphaFold2。AlphaFold2能够成功满足几个条件:

  • 第一点,它是一个well-defined problem,从蛋白质的氨基酸的序列到三维的结构的mapping;

  • 第二点,30年前就开始的CASP竞赛,每次竞赛有标准的数据集,每次解析出的蛋白质序列,大家都可以公开上传;

  • 第三点,数据本身是well-structured,AI新算法可以直接使用。

第一位把深度学习用于蛋白质三维结构预测的是芝加哥大学丰田研究院许锦波教授,他现在也是清华大学智能产业研究院(AIR)的卓越访问教授。当时在CASP,他把ResNet用到蛋白质三维结构解析,获得巨大成功。

现在AlphaFold用的是evolutioned Transformer,以后新的算法都可以用上,所以我觉得这是一个非常经典的案例。

我们希望在这个后AlphaFold时代,特别是在大分子制药方面会有更多进展。

打造AI生命科学干湿闭环实验的新的范式。现在AI算法还是辅助,主要还是靠生物的湿实验。未来会有一种新的模式是AI驱动的,完全自动化所有环节的湿实验,里面没有任何人的参与,这个是比较困难的,也是一种新的尝试。

最后做一个总结,现在整个生物世界在走向数字化、自动化,也包括智能科学计算,像分子动力学,薛定谔方程等,都会和AI相辅相成。另外计算的方式,包括AI、数字驱动、第一性原理等,也将快速地帮助我们解决生命健康的一些问题。

由于这些进展,我们整个生命科学的生物制药会更加快速精准、更安全、更经济、更加普惠。但很多的挑战我们没有讲,比如算法的透明性、可解释性、隐私安全、伦理等,这些事情都需要我们关注。我相信未来十年是整个生物制药和人工智能融合的大好时机,也是行业发展的最大的机遇,谢谢大家。

meet2022智能未来大会今日举行,李开复张亚勤上演巅峰对话

...;预见智能未来。智能未来已到「看见」时刻,李开复张亚勤巅峰对话创新工场董事长兼CEO李开复;清华智能产业研究院院长张亚勤;百度集团副总裁、深度学习技术及应用国家工程实验室副主任吴甜;IBM中国研发... 查看详情

meet大会报名开启|李开复张亚勤等产学研大咖邀你共同见证智能未来

组委会发自凹非寺量子位报道|公众号QbitAI发电机在1820年代发明,直到1880年代白炽灯被点亮,才让所有人相信电力就是未来;汽油内燃机在1866年出现,直到1908年福特T型车推出,才让所有人相信交通出行已经... 查看详情

李开复张亚勤巅峰对话,还有虚拟人自动驾驶论坛,今年meet智能未来大会,我蚌埠住了...

...的VC代表,一个是世界级科学家及企业家,李开复张亚勤两位老朋友再聚首,将会上演怎样的巅峰对话?自动驾驶Panel有。作为自动驾驶领域最具影响力和号召力的第三方,每年都会有业内商业化代表前来圆桌... 查看详情

清华大学air院长张亚勤:智能时代计算架构将走向分布式边缘计算

...会期间,清华大学智能产业研究院(AIR)院长张亚勤接受新浪科技采访时指出,全球计算产业在经历了大型机时代的完全集中式架构,PC时代的完全分布式架构,以及移动互联网时代"集中+分布式"... 查看详情

探秘未来偶像:知识图谱如何给ai“生命感”

AI是个非常有趣的词,不管是中文翻译的人工智能,还是英文的ArtificialIntelligence,都有“生物性”的含义。一个是集结了地球顶尖智慧的“人工”,另一个Intelligence则专指生物拥有的智慧。不过在当今的AI风潮中,我们提到的种... 查看详情

sas宣布未来3年投入10亿美元布局ai应用领域

... 数据分析软件厂商SAS(赛仕计算机软件)22日宣布,将于未来3年投入10亿美元在AI领域,用以推动分析技术的发展,并着重软件研发创新、客户教育、顾问服务3大面向。目前大和证券(DaiwaSecurities)、营销顾问公司ConnexionsLoyalty,以... 查看详情

18年后,张亚勤李开复王坚沈向洋洪小文等又干了件大事

650)this.width=650;"src="http://s2.51cto.com/wyfs02/M00/8A/49/wKiom1gsX26CdlitAAHg8UigDnk148.jpg-wh_500x0-wm_3-wmp_4-s_2513557738.jpg"title="五巨头1.jpg"alt="wKiom1gsX26CdlitAAHg8UigDnk148.jpg-wh_50"/>(上 查看详情

马云谈ai:未来10-15年传统制造业的痛苦将远超今天的想象

  马云谈AI:未来10-15年传统制造业的痛苦将远超今天的想象  “未来10到15年,传统制造业面临的痛苦将会远远超过今天的想象,企业如果不能从规模化、标准化向个性化和智慧化转型,将很难生存下去。”  9月17日,“2... 查看详情

李开复:未来15年ai将接管人类一半工作

...月13日消息,李开复近日在樊登读书节目中表示,未来15年,人工智能会接管我们现在一半的工作和工作里的任务。李开复称,至少一半人的工作,其实是单一领域重复性的工作。人工智能的这种取代,对... 查看详情

新书推荐崛起的超级智能:互联网大脑如何影响科技未来

...版社正式出版。作者刘锋。吕乃基、石勇、吕本富做序。张亚勤、刘慈欣、周鸿祎、王飞跃、约翰.翰兹等专家为这本书撰写了推荐语。          《崛起的超级智能》主要阐述了21世纪以来人工智能、云计算、大数据工业4.0... 查看详情

hintondall-e2皆上榜,盘点ai图像10年合成史!

...模型在生成图像上的表现已经非常出色。 很显然,未来还会给我们更多的惊喜。 这十年来,是如何走到今天这一步的?在下面的时间线里,将会追溯一些里程碑式的时刻,例如AI图像合成的论 查看详情

hintondall-e2皆上榜,盘点ai图像10年合成史!

...模型在生成图像上的表现已经非常出色。 很显然,未来还会给我们更多的惊喜。 这十年来,是如何走到今天这一步的?在下面的时间线里,将会追溯一些里程碑式的时刻,例如AI图像合成的论 查看详情

2018走向成熟2019未来可期|paddlepaddle大有可为

深度学习框架如同智能时代的“发电机”,让人工智能技术更快速地普及到各行各业,推动融合创新,成为智能时代最重要的基础设施。PaddlePaddle作为目前国内唯一功能完备的深度学习框架,经过2018年的快速成长,初具模型领... 查看详情

2018走向成熟2019未来可期|paddlepaddle大有可为

深度学习框架如同智能时代的“发电机”,让人工智能技术更快速地普及到各行各业,推动融合创新,成为智能时代最重要的基础设施。PaddlePaddle作为目前国内唯一功能完备的深度学习框架,经过2018年的快速成长,初具模型领... 查看详情

大数据&ai人工智能源动力:改变未来世界的5大核心力量

海量连接、生物融合、人类扩张、深度自动化、智能爆炸目录改变一切的5种力量1.海量连接2.生物融合3.人类扩张4.深度自动化 查看详情

未来5-10年10%的工作可能会被机器人替代,没有专业技能,我们将面临失业?

...器人、人工智能来临时对人们工作与收入的影响,“估计未来5-10年工业化国家可能10%的工作会消失。”这意味着什么,相信大家都知道,没有专业技能的工作可能终将被机器人所替代,那时候有可能大批人会面临着下岗。而我... 查看详情

未来偶像的硬件破局:为爱买单,不为ai买单

在过去一年里,我们对智能音箱进行了无数次吐槽,如今智能音箱(以及多种类似概念的产品)最热闹的时候已经过去了,也是时候验证我们的判断。果然,Gfk数据显示在过去的一年里,2017年中国智能音箱销量仅35万台,而年中... 查看详情

lecun用62页论文公布未来十年研究计划:ai自主智能

...色发自凹非寺量子位|公众号QbitAI这段时间,关于“AI未来往哪走的”讨论,可以说是越来越激烈了。先是Meta被曝AI相关部门大重组,又有谷歌AI是否具备人格大讨论,几乎每一次讨论都能看到YannLeCun的身影。现在&#... 查看详情