正文

搞科研新姿势：让gpt-3给你打下手

QbitAl  QbitAl  2023-03-12  620

关键词：

金磊发自凹非寺
量子位 | 公众号 QbitAI

搞科研的最新姿势，被一位华人小哥解锁了——

告诉AI你的研究目标，再把数据集“投喂”进去，完事。

这就是来自伯克利的博士生Zhong Ruiqi等人的最新研究，把从海量数据集中繁琐的“取证”过程，统统交给GPT-3来解决：

他们还发现，这种用AI搞科研的方法不仅效率高，而且还能得出人类没有想到的“意外惊喜”。

让GPT-3帮你搞科研

那么小哥他们为什么突发奇想地要用这种方式搞科研呢？

这是因为他们发现，对大型语料库做深入的挖掘确实能得到一些有用的结果，但这个过程要是让人类来搞，那简直就太费时费力了。

因此，他们便决定把这个繁琐的过程交给GPT-3来处理，并把这个任务命名为“D5”：

Goal Driven Discovery of Distributional Differences via Language Descriptions.

通过语言描述，实现目标驱动的分布式差异的发现。

“D5”任务的过程，简单来说就是两个动作：

输入研究目标
输入两个语料库

例如在上面这个案例中，小哥先是给AI输进去了两个语料库：

语料库A：服用药物A后患者的反应报告
语料库B：服用药物B后患者的反应报告

然后再向AI确定自己的研究目标，即“我想了解一下药物A的副作用”。

在AI收到任务后，立刻开始执行分析工作，最后得出了它的结论：

语料库A中的样本，有更多的患者会提到“妄想症”（paranoia）。

不过试想一下，若让人类科研人员做这项工作，光是了解语料库A和B就需要花费大量的时间，更别提还得进一步做对比分析等工作了。

而D5任务之所以能够做得如此丝滑，是因为小哥他们在此背后还做了不少工作。

例如构建OpenD5元数据集，它包含符合D5任务的675个开放式问题，所涉及领域涵盖商业、社会科学、人文科学、健康和机器学习等。

并且每个开放式问题都会对应一个语料库对儿（语料库A和语料库B），平均有17000个样本。

小哥还把每个语料库中的50%作为研究部分，另外50%则是拿来做验证。

基于此，小哥他们再构建了一个“D5系统”，它的工作原理和人类从数据库中获取发现类似，分为两个阶段，即创造性地提出一个假设，再在数据集上严格验证这个假设。

按照这种思路，研究人员接下来用GPT-3做了次实验。

他们先是向GPT3展示研究目标和每个语料库中的一些样本，然后让它提出一个假设列表。

最终实验发现，GPT-3可以使用目标描述来提出更相关、更新颖、更有意义的假设。

也正因为OpenD5数据集所涵盖的领域众多，因此小哥表示他们的D5系统具备应用范围广的特点。

也存在一些缺陷

但对于这套D5系统，小哥也直言不讳地道出了它的缺陷。

例如，若是语料库中含有较多的俚语、俗语或者带有情绪的词汇，那么AI所给出的“发现”就会存在偏差。

简而言之，就是AI对于特定情况的词汇或描述产生了错误的理解和分析。

除此之外，小哥也表示更灵活的语料库、更具扩展性的系统，也是他们在未来重点研究的方向。

不过似乎这项研究让小哥也是兴奋不已，毕竟离他“构建一个用AI稿科研”的梦想更近了一步。

参考链接：

[1] https://arxiv.org/abs/2302.14233
[2] https://twitter.com/ZhongRuiqi/status/1631109680859865089?s=20

改代码超级快！gpt-3新增编辑与插入文本功能，ai能为你写诗了

...次又增加了些什么新功能？AI界的明星研究所、老是搞事情的OpenAI，最近又搞了个事情：GPT-3增加了两项新功能：「编辑」与「插入」。「编辑」让GPT-3更贴近真正的人类过去࿰ 查看详情

在软件工程领域，搞科研的这十年！

文|刘杨出品|《新程序员》编辑部技术的发展离不开科研的创新和工程的落地，本文作者刘杨的程序人生起于兴趣，成于夜以继日地编程和科研，而后他将工程与科研相结合，对软件工程数字化进行深入的研究与... 查看详情

在软件工程领域，搞科研的这十年！

技术的发展离不开科研的创新和工程的落地，本文作者刘杨的程序人生起于兴趣，成于夜以继日地编程和科研，而后他将工程与科研相结合，对软件工程数字化进行深入的研究与实践。本文中，他分享了在开... 查看详情

这家为aiforscience而生的新研究院，要让科研进入“安卓模式”

梦晨发自凹非寺量子位报道|公众号QbitAIAIforScience，这个概念是什么时候火起来的？一个引爆点，在2021年7月，AlphaFold2开源并一口气预测了98.5%的人类蛋白质结构，向世人展示了AI在科学研究领域解决实际问题的... 查看详情

方向对了？mit新研究：gpt-3和人类大脑处理语言的方式惊人相似

机器之心报道「人工智能网络并没有试图直接模仿大脑，然而最终看起来像大脑一样，这在某种意义上表明，人工智能和自然之间发生了某种趋同演化。」计算机擅长理解结构化数据，让计算机去理解主要以文化... 查看详情

什么样的人适合搞科研?

链接：https://www.zhihu.com/question/25009199编辑：深度学习与计算机视觉声明：仅做学术分享，侵删作者：febyhttps://www.zhihu.com/question/25009199/answer/695326020这个我必须要以亲身经历作答。我老板南开大学数学系本硕博&#... 查看详情

gpt-4：不了不了，这些我还做不到

...对于有视觉障碍的人群来说，无疑为提高他们的生活便捷打下了坚实的基础。GPT-4在这一方面也有了具体的应用：一款名为BeMyEyes的APP正在开发GPT-4驱动的虚拟志愿者，希望能为盲人、低视力群体提供视觉帮助。不过据官方宣布图... 查看详情

七夕秀恩爱新姿势！这波操作我给十分！(代码片段)

一、前言像每一滴酒回不了最初的葡萄，我回不到年少。爱情亦是如此，这就是写一篇小程序的初衷，用来记录我和她最美的恋爱。什么是最美恋爱？就是繁忙之余的一封书信，一起奋斗的目标，精彩的瞬间，旅游的足迹，和那... 查看详情

gpt-4即将问世！不仅能搞文字，还支持视频

整理|郑丽媛出品|CSDN（ID：CSDNnews）作为当前全球最火的生成式AI，ChatGPT仅用了3个月，就几乎搅动了整个科技圈，人们不断惊叹于ChatGPT的强大——但微软和OpenAI想要的，显然不至于此。目前的ChatGPT... 查看详情

20191225新姿势

KalmanFilter通俗讲解KalmanFilter:理解卡尔曼滤波的三重境界查看详情

jsoncsrf新姿势

...POST数据为JSON数据的CSRF，一直没有搞定，最近发现一个新姿势，???本文作者：[email protected]安全文库微信公众号：安全文库测试的时候，当应用程序验证了Content-type和dataformat，这种新姿势依然可以可以使用flash和307重定向来... 查看详情

学术科研无从下手？27条机器学习避坑指南，让你的论文发表少走弯路

...「避坑指南」可千万不要错过了。关键词：机器学习科研规范学术研究机器学习学术小白，如何优雅避坑坑、让自己的论文顺利发表？来自苏格兰赫瑞瓦特大学数学与计算机科学学院的MichaelA.Lones副教授，曾在2021... 查看详情

原来ai也需要有人哄，一句话让gpt-3准确率暴涨61%

...区炸了锅。因为最新研究发现，只要对GPT-3说一句“让我们一步一步地思考”，就能让它正确回答出以前不会的问题。比如下面这个例子：16个球中有一半是高尔夫球，这些高尔夫球中有一半是蓝色的，一共有... 查看详情

openai开放gpt-3微调功能，让开发者笑开了花(代码片段)

...智能工作负载。”定制的GPT-3只需一行代码，就可以让开发人员和业务团队基于特定数据集运行和训练强大的AI模型，从而无需从头开始创建和训练自己的AI系统。openaiapifine_tunes.create-t<train_file>通过微调，能够将... 查看详情

20+顶尖高校同时开打《王者荣耀》！实际上是一场科研battle，你能信？

...势”都那么与众不同：他们竟然要用《王者荣耀》搞科研！（妥妥的是有种诸葛查看详情

[经验分享]gpt-3.5-turbo|unity中实现http接口调用gpt新接口以及信息处理的实现案例分享

...davinci-003模型做了一个galgame的AI女友对话的demo。这次趁着新接口的发布，对这个demo也同步更新了模型调用的代码。本篇文章将分享一下，如何在unity里使用UnityWebRequest实现与openAI的接口调用以及信息处理的示例，希望... 查看详情

科研必备，破解大数据散点overlap的6种姿势(代码片段)

当有大量数据点在一张图中散点图展示时，会出现如下状况，library(ggplot2)x<-rnorm(n=10000)y<-rnorm(n=10000,sd=2)+xdf<-data.frame(x,y)ggplot(df,aes(x,y))+geom_point(colour="blue")大量点重叠在一起，有的区域直... 查看详情

正文

搞科研新姿势：让gpt-3给你打下手

金磊 发自 凹非寺量子位 | 公众号 QbitAI

让GPT-3帮你搞科研

也存在一些缺陷

改代码超级快！gpt-3新增编辑与插入文本功能，ai能为你写诗了

在软件工程领域，搞科研的这十年！

在软件工程领域，搞科研的这十年！

这家为aiforscience而生的新研究院，要让科研进入“安卓模式”

方向对了？mit新研究：gpt-3和人类大脑处理语言的方式惊人相似

什么样的人适合搞科研?

gpt-4：不了不了，这些我还做不到

七夕秀恩爱新姿势！这波操作我给十分！(代码片段)

gpt-4即将问世！不仅能搞文字，还支持视频

20191225新姿势

jsoncsrf新姿势

学术科研无从下手？27条机器学习避坑指南，让你的论文发表少走弯路

原来ai也需要有人哄，一句话让gpt-3准确率暴涨61%

openai开放gpt-3微调功能，让开发者笑开了花(代码片段)

20+顶尖高校同时开打《王者荣耀》！实际上是一场科研battle，你能信？

[经验分享]gpt-3.5-turbo|unity中实现http接口调用gpt新接口以及信息处理的实现案例分享

科研必备，破解大数据散点overlap的6种姿势(代码片段)

哄一哄能让gpt-3准确率暴涨61%！谷歌&东京大学研究震惊四座

金磊发自凹非寺
量子位 | 公众号 QbitAI