搞科研新姿势:让gpt-3给你打下手

QbitAl QbitAl     2023-03-12     620

关键词:

金磊 发自 凹非寺
量子位 | 公众号 QbitAI

搞科研的最新姿势,被一位华人小哥解锁了——

告诉AI你的研究目标,再把数据集“投喂”进去,完事。

这就是来自伯克利的博士生Zhong Ruiqi等人的最新研究,把从海量数据集中繁琐的“取证”过程,统统交给GPT-3来解决:

他们还发现,这种用AI搞科研的方法不仅效率高,而且还能得出人类没有想到的“意外惊喜”。

让GPT-3帮你搞科研

那么小哥他们为什么突发奇想地要用这种方式搞科研呢?

这是因为他们发现,对大型语料库做深入的挖掘确实能得到一些有用的结果,但这个过程要是让人类来搞,那简直就太费时费力了。

因此,他们便决定把这个繁琐的过程交给GPT-3来处理,并把这个任务命名为“D5”

Goal Driven Discovery of Distributional Differences via Language Descriptions.

通过语言描述,实现目标驱动的分布式差异的发现。

“D5”任务的过程,简单来说就是两个动作:

  • 输入研究目标

  • 输入两个语料库

例如在上面这个案例中,小哥先是给AI输进去了两个语料库:

  • 语料库A:服用药物A后患者的反应报告

  • 语料库B:服用药物B后患者的反应报告

然后再向AI确定自己的研究目标,即“我想了解一下药物A的副作用”。

在AI收到任务后,立刻开始执行分析工作,最后得出了它的结论:

语料库A中的样本,有更多的患者会提到“妄想症”(paranoia)。

不过试想一下,若让人类科研人员做这项工作,光是了解语料库A和B就需要花费大量的时间,更别提还得进一步做对比分析等工作了。

而D5任务之所以能够做得如此丝滑,是因为小哥他们在此背后还做了不少工作。

例如构建OpenD5元数据集,它包含符合D5任务的675个开放式问题,所涉及领域涵盖商业、社会科学、人文科学、健康和机器学习等。

并且每个开放式问题都会对应一个语料库对儿(语料库A和语料库B),平均有17000个样本。

小哥还把每个语料库中的50%作为研究部分,另外50%则是拿来做验证。

基于此,小哥他们再构建了一个“D5系统”,它的工作原理和人类从数据库中获取发现类似,分为两个阶段,即创造性地提出一个假设,再在数据集上严格验证这个假设。

按照这种思路,研究人员接下来用GPT-3做了次实验。

他们先是向GPT3展示研究目标和每个语料库中的一些样本,然后让它提出一个假设列表。

最终实验发现,GPT-3可以使用目标描述来提出更相关、更新颖、更有意义的假设。

也正因为OpenD5数据集所涵盖的领域众多,因此小哥表示他们的D5系统具备应用范围广的特点。

也存在一些缺陷

但对于这套D5系统,小哥也直言不讳地道出了它的缺陷。

例如,若是语料库中含有较多的俚语、俗语或者带有情绪的词汇,那么AI所给出的“发现”就会存在偏差。

简而言之,就是AI对于特定情况的词汇或描述产生了错误的理解和分析。

除此之外,小哥也表示更灵活的语料库、更具扩展性的系统,也是他们在未来重点研究的方向。

不过似乎这项研究让小哥也是兴奋不已,毕竟离他“构建一个用AI稿科研”的梦想更近了一步。

参考链接:

[1] https://arxiv.org/abs/2302.14233
[2] https://twitter.com/ZhongRuiqi/status/1631109680859865089?s=20

改代码超级快!gpt-3新增编辑与插入文本功能,ai能为你写诗了

...次又增加了些什么新功能?AI界的明星研究所、老是搞事情的OpenAI,最近又搞了个事情:GPT-3增加了两项新功能:「编辑」与「插入」。「编辑」让GPT-3更贴近真正的人类过去࿰ 查看详情

在软件工程领域,搞科研的这十年!

文|刘杨出品|《新程序员》编辑部技术的发展离不开科研的创新和工程的落地,本文作者刘杨的程序人生起于兴趣,成于夜以继日地编程和科研,而后他将工程与科研相结合,对软件工程数字化进行深入的研究与... 查看详情

在软件工程领域,搞科研的这十年!

技术的发展离不开科研的创新和工程的落地,本文作者刘杨的程序人生起于兴趣,成于夜以继日地编程和科研,而后他将工程与科研相结合,对软件工程数字化进行深入的研究与实践。本文中,他分享了在开... 查看详情

这家为aiforscience而生的新研究院,要让科研进入“安卓模式”

梦晨发自凹非寺量子位报道|公众号QbitAIAIforScience,这个概念是什么时候火起来的?一个引爆点,在2021年7月,AlphaFold2开源并一口气预测了98.5%的人类蛋白质结构,向世人展示了AI在科学研究领域解决实际问题的... 查看详情

方向对了?mit新研究:gpt-3和人类大脑处理语言的方式惊人相似

机器之心报道「人工智能网络并没有试图直接模仿大脑,然而最终看起来像大脑一样,这在某种意义上表明,人工智能和自然之间发生了某种趋同演化。」计算机擅长理解结构化数据,让计算机去理解主要以文化... 查看详情

什么样的人适合搞科研?

链接:https://www.zhihu.com/question/25009199编辑:深度学习与计算机视觉声明:仅做学术分享,侵删作者:febyhttps://www.zhihu.com/question/25009199/answer/695326020这个我必须要以亲身经历作答。我老板南开大学数学系本硕博&#... 查看详情

gpt-4:不了不了,这些我还做不到

...对于有视觉障碍的人群来说,无疑为提高他们的生活便捷打下了坚实的基础。GPT-4在这一方面也有了具体的应用:一款名为BeMyEyes的APP正在开发GPT-4驱动的虚拟志愿者,希望能为盲人、低视力群体提供视觉帮助。不过据官方宣布图... 查看详情

七夕秀恩爱新姿势!这波操作我给十分!(代码片段)

一、前言像每一滴酒回不了最初的葡萄,我回不到年少。爱情亦是如此,这就是写一篇小程序的初衷,用来记录我和她最美的恋爱。什么是最美恋爱?就是繁忙之余的一封书信,一起奋斗的目标,精彩的瞬间,旅游的足迹,和那... 查看详情

gpt-4即将问世!不仅能搞文字,还支持视频

 整理|郑丽媛出品|CSDN(ID:CSDNnews)作为当前全球最火的生成式AI,ChatGPT仅用了3个月,就几乎搅动了整个科技圈,人们不断惊叹于ChatGPT的强大——但微软和OpenAI想要的,显然不至于此。目前的ChatGPT... 查看详情

20191225新姿势

 KalmanFilter通俗讲解KalmanFilter:理解卡尔曼滤波的三重境界  查看详情

jsoncsrf新姿势

...POST数据为JSON数据的CSRF,一直没有搞定,最近发现一个新姿势,???本文作者:[email protected]安全文库微信公众号:安全文库测试的时候,当应用程序验证了Content-type和dataformat,这种新姿势依然可以可以使用flash和307重定向来... 查看详情

学术科研无从下手?27条机器学习避坑指南,让你的论文发表少走弯路

...「避坑指南」可千万不要错过了。关键词:机器学习科研规范学术研究机器学习学术小白,如何优雅避坑坑、让自己的论文顺利发表?来自苏格兰赫瑞瓦特大学数学与计算机科学学院的MichaelA.Lones副教授,曾在2021... 查看详情

原来ai也需要有人哄,一句话让gpt-3准确率暴涨61%

...区炸了锅。因为最新研究发现,只要对GPT-3说一句“让我们一步一步地思考”,就能让它正确回答出以前不会的问题。比如下面这个例子:16个球中有一半是高尔夫球,这些高尔夫球中有一半是蓝色的,一共有... 查看详情

openai开放gpt-3微调功能,让开发者笑开了花(代码片段)

...智能工作负载。”定制的GPT-3只需一行代码,就可以让开发人员和业务团队基于特定数据集运行和训练强大的AI模型,从而无需从头开始创建和训练自己的AI系统。openaiapifine_tunes.create-t<train_file>通过微调,能够将... 查看详情

20+顶尖高校同时开打《王者荣耀》!实际上是一场科研battle,你能信?

...势”都那么与众不同:他们竟然要用《王者荣耀》搞科研!(妥妥的是有种诸葛 查看详情

[经验分享]gpt-3.5-turbo|unity中实现http接口调用gpt新接口以及信息处理的实现案例分享

...davinci-003模型做了一个galgame的AI女友对话的demo。这次趁着新接口的发布,对这个demo也同步更新了模型调用的代码。本篇文章将分享一下,如何在unity里使用UnityWebRequest实现与openAI的接口调用以及信息处理的示例,希望... 查看详情

科研必备,破解大数据散点overlap的6种姿势(代码片段)

当有大量数据点在一张图中散点图展示时,会出现如下状况,library(ggplot2)x<-rnorm(n=10000)y<-rnorm(n=10000,sd=2)+xdf<-data.frame(x,y)ggplot(df,aes(x,y))+geom_point(colour="blue")大量点重叠在一起,有的区域直... 查看详情

哄一哄能让gpt-3准确率暴涨61%!谷歌&东京大学研究震惊四座

...区炸了锅。因为最新研究发现,只要对GPT-3说一句“让我们一步一步地思考”,就能让它正确回答出以前不会的问题。比如下面这个例子:16个球中有一半是高尔夫球,这些高尔夫球中有一半是蓝色的,一共有... 查看详情