论文图片误用?ai:这条路已被我堵死了

QbitAl QbitAl     2023-03-04     309

关键词:

博雯 发自 凹非寺
量子位 报道 | 公众号 QbitAI

现在的AI已经开始参与论文打假了!

就像是这样,经过旋转、拉伸和缩放之后的图片,人眼或许无法辨认,但AI能看到数百个相似的特征:

蓝色线条表示相似特征

即使通过高超的“图像处理手段”把一张完整图像中的局部画面挪到自己的图像里,也能一眼分辨:

对于AI来说,这可能是秒认的活儿,甚至就算是一篇图像繁杂的完整论文,也不过花费一两分钟。

但对于人眼可就没那么简单了,比如知名学术打假人Elisabeth Bik为了寻找不同论文中使用相同图片展示各自不同的实验结果的例子,曾花费了整整2年时间。

而对于出版商们来说,刊登又撤稿中间的损失就更大了……

因此,最近几年,AI打假员愈发频繁地被引入了论文审查,尤其是图像问题中。

比如,自今年1月份开始,世界上最大、最古老的癌症研究专业协会,美国癌症协会(AACR)就已经开始使用AI软件来评审旗下期刊文章里的图片造假或重复问题了。

官方网站上也已经写明:提交手稿中的所有图像都需要通过AI软件进行筛选。

不仅是AACR,世界第五大出版商SAGE、老牌经典医学期刊JCI、 JCI Insight都已经用上了这种方法。

自动图像校对

这些期刊和出版商们所使用的是一个由以色列公司Proofig开发的同名软件。

Proofig软件基于AI技术和图像处理技术,面向各种科学文稿中的图像,包括所有类型的显微镜照片(光学、电学、共聚焦)、载玻片、蛋白免疫印迹(Western blot)、生物体内和体外图像、植物图像等等。

软件会从论文中识别图像,然后提取它们共同的特征进行比较。

这些“共同的特征”包括对图像整体的缩放或旋转、部分重复或重叠、还有一些方位上的不同。

除此之外,软件也能额外检测到一些问题,比如高分辨率的原始数据被压缩到更小的文件中时,可能出现的压缩失真或压缩伪影(Compression artifact)情况。

一篇普通的论文通常在2分钟以内可以检查完毕,最多不超过10分钟。

对于很多出版商来说,一篇已刊登的科学文稿里如果出现图像剽窃这种学术不端的现象,那么从调查、撤稿到后续的法律费用,平均每篇文章可能要损失百万美元。

因此,很多出版商都乐意引入性价比较高的AI来和人工审查组一起工作。

AACR的一位期刊运营总监就表示:

很多作者也很高兴能在出版前注意到一些“无意中的”图像复制错误。

而对于我们来说,严谨的数据是我们期刊的一个显著的标志,因此,这(Proofig)绝对是值得投入的时间和金钱。

出版商们联合起来

其实,科学文稿中的图像重复或剽窃的现象已经是屡见不鲜了。

2016年,Nature上就有一篇文章对约2万篇生物医学论文进行人工分析后发现,其中4%的论文都可能包含上述问题。

而通常每年只有1%的文稿得到更正,因此撤回的文章就更少了。

因此,去年5月份,一些出版商联合起来成立了一个为解决论文中图像问题的小组,其中包括荷兰出版业巨头爱思唯尔(Elsevier)、Wiley、Springer Nature和Taylor & Francis。

爱思唯尔表示,小组最终的目标是“创造一个能够帮助我们自动识别图像变化的环境。”

还有很多出版商试图自己解决问题,比如瑞士出版商Frontiers开发了自己的论文图像检查软件,作为自动检查系统AIRA的一部分。

Frontiers内部的一位发言人表示,软件自2020年8月投入使用,标记的大多数论文都没有问题, 只有大约10%的论文需要人工检查小组的跟踪处理。

而有些尚未引入AI手段的出版商也展现出了对这种方法的怀疑:

在可靠性上,AI检查还没有大规模地投入使用。比如爱思唯尔的软件目前的进度还是“正在测试中“,只对部分期刊开放使用。

在成本上,AI软件偶尔的“误杀”依旧需要人工参与,甚至会引起其他的纠纷。

不过有人从另一个角度提出了问题:

如果所有的论文都是开放存取的,那么图像误用/重复问题将更容易得到审查,训练AI也会更有效率。

参考链接:
[1]https://www.nature.com/articles/d41586-021-03807-6
[2]https://www.nature.com/articles/nature.2016.19802

为什么我会选择走java这条路?

...员江湖】最近有一些小伙伴问我,为什么当初选择走Java这条路,为什么不做C++、前端之类的方向呢,另外还有一些声音:研究生不是应该去做算法方向么,本科生不就可以做开发了吗,为什么还要读研呢。其实吧,这个问题搁... 查看详情

ai学的好,轻松拿高薪--人工智能大厂面试题

...方面的,特别是许多的研究生们也是有想走人工智能这条路,的确,对于他们来说,想要更高的薪酬,走这条路就是一个不错的选择!进大厂是不是都是大家的梦想,这里整理了一些面试题目感兴趣的... 查看详情

ai作画的业界天花板被我找到了,aigc模型揭秘|昆仑万维

一、前景1、AI和AIGC的关系人工智能(ArtificialIntelligence),英文缩写为AI。它是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。AIGC是继UGC、PGC之后新型利用AI技术自动... 查看详情

oi这条路,我只能边膜边走——byjr_coder

无聊开始谢谢自己近一年来学写code的经历【初识OI】  刚开始是被骗进来的...因为小学读的奥数==所以屁颠屁颠地跟着各班dalao来到了这个机房。开始学Pascal(那个时候老郭还在机房的电脑里下载了一个Logo...)【颓废期】 &nbs... 查看详情

我是如何走上csdn这条路的

大家好,我是记得诚。写文章这么久了,也没有好好介绍自己。我是90后,2012年上的大学,电子信息工程专业,普通的学校,大一挺勤奋的,高考考的不好,就想着考研弥补一下,所以天天去图... 查看详情

我是如何走上csdn这条路的

大家好,我是记得诚。写文章这么久了,也没有好好介绍自己。我是90后,2012年上的大学,电子信息工程专业,普通的学校,大一挺勤奋的,高考考的不好,就想着考研弥补一下,所以天天去图... 查看详情

该不该放弃嵌入式,单片机这条路?

转自我的知乎回答:https://www.zhihu.com/question/370606355/answer/1126593214我是17年毕业的不知道是不是同一年的,我毕业前四个月的时候去了一家地理测绘公司的无人机部门,做的是硬件实习生(后边转正也是转的硬件工... 查看详情

该不该放弃嵌入式,单片机这条路?

转自我的知乎回答:https://www.zhihu.com/question/370606355/answer/1126593214我是17年毕业的不知道是不是同一年的,我毕业前四个月的时候去了一家地理测绘公司的无人机部门,做的是硬件实习生(后边转正也是转的硬件工... 查看详情

我愿在程序员这条路越走越远

  今天偶尔和朋友谈起,他对于我选择IT表示很是惊讶,因为IT和我以前学的专业完全不对口。他还说程序猿应该都是比较闷骚的人,本想反驳一句,但想想应该说的没差。因为我的第一感觉也是这样的。  大概是对于新鲜... 查看详情

前端这条路,我们该何去何从

原文地址:https://www.usblog.cc/blog/post/justzhl/前端这条路,我们该何去何从这样,因为你会发现,如果你觉得某个教程写的不好,那可能很难找到一个教程适合你的,不是因为别人教程写的差(除非特别那种的),而是你该问问自... 查看详情

毕业四年,我当初是如何走上编程这条路的!

起初感概万千,毕业已达4年之久。想起在大学时期学习编程的事情,感觉很有意义,在此记录回顾一下。希望自己初心未变,勇往向前现状与过去20210706目前的我是在天津一家公司做测试开发。从毕业实习到现在... 查看详情

为啥我的背景图片在底部被我的 CSS 截断了?

】为啥我的背景图片在底部被我的CSS截断了?【英文标题】:WhyismybackgroundimagecutoffatthebottombymyCSS?为什么我的背景图片在底部被我的CSS截断了?【发布时间】:2019-01-0316:51:39【问题描述】:我正在尝试创建一个页面,其中背景图... 查看详情

lungnoduledetection------worklog

...究了很长的时间的肺结节检测,但那都是只限于研究和写论文,现在我想把大家的研究落地。虽然现在有很多做医疗的公司已经做了很多的相关的项目,很多项目展示出来还是很好看的,很多是医院的示范工程,但这样的牛逼的... 查看详情

程序员这条路,技术往深度走还是广度走会比较好?看完这篇文章你就明白了

有人认为程序员应该对自己的技术始终保持忠诚,有人认为集百家武学于一身才是正道,如何权衡技术深度与广度?这是大多数程序员都会面临和思考的问题。在有限的时间里能学习的东西也是有限的,那么在我... 查看详情

afo

...会再去做了还有很多场比赛没有时间打了但是既然选择了这条路,就不要抱怨这条路难走如果再让我选一次我还会像那时一样说一句OI,我来了!我的中学时代最浪漫的事或许 查看详情

15001_真正的出路

...每个路口的旁边上面都写了一句话,第一个路上写着:“这条路通向迷宫的出口。”第二个路口上写着:“这条路不通向迷宫的出口。”第三个路口上写着:“另外两条路上写的话,一句真的,一句是假的,我们保证,上述的话... 查看详情

toppaper:ai初学者经典论文列表

无论你是学习机器学习还是深度学习,看学术论文必不可少。作为AI初学者而言,如何挑选更适合自己、更容易学习的AI论文尤为重要!真的会起到事半功倍的效果。今天给大家推荐一个非常不错的GitHub开源项目:... 查看详情

大数据&ai人工智能图灵:计算机器与智能-经典ai论文系列

目录引言 模仿游戏机器谁反对?学习机引言 经典AI论文这个系列的产生主要是出于这样一个想法:现在每年人工智能相关的顶会文章,一年下来都有上万篇,论文似乎永远都读不完.然而,这些论文真正的价值有多少呢?有多少论... 查看详情