Meta大模型成了“科学造假发动机”，发布3天就在争议中下架

日期：2022-11-18发布：www.qubaike.com

梦晨发自凹非寺量子位 | 公众号 QbitAI

Meta最新大模型差点成了“科研造假发动机”，刚出3天就在争议中下架。

1200亿参数语言模型Galactica，在4800万篇学术论文和各式教科书、百科等数据上训练而来。

（与太空堡垒卡拉狄加同名）

其本意是想解决学术界信息过载，帮助研究人员做信息梳理、知识推理和写作辅助，一度被认为是“科研者的福音”，或者“写论文的Copilot”。

But，一经开放使用，很快就被网友们发现了大问题。

它确实能为自己生成的内容引用文献，但有时这个文献并不存在，作者却是真实存在的人。

它能生成看起来像模像样的科普文字，但内容却是完全错误的。

△真空中的光速和声速接近可还行？

著名的Gary·AI悲观主义者·Marcus也来吐槽，Galactica把他的出生日期、教育经历和研究领域等信息全搞错了。

对以上种种问题，马克斯普朗克智能系统研究所所长Michael Black总结道：

这将开启一个科学深度造假（deep scientific fakes）的时代。会出现研究者从未写过的虚假论文，这些论文随后会被其他真实的论文引用，简直乱套了。

虽然他也注意到，Galactica的开发者在每个输出内容后都加了“内容可能不可靠”的警告，但“潘多拉的魔盒一旦开启，就关不上了”。

事实上他的担忧不无道理，AI生成内容的速度要比人类快的多，一旦大量被搜索引擎抓取就有可能出现在前排，甚至被当成正确答案展示在最上面，误导更多人。

这样的争议持续了两三天，团队只好无奈宣布Demo暂时下架，论文和源代码继续开放给相关领域研究者。

作为Meta首席科学家，LeCun对这个局面并不满意。

与他观点一致的网友认为，Galactica是有帮助且有趣的，只是被个别人滥用了。

本意是好的

Galactica由Meta AI与Papers with Code合作开发。

在论文引言部分，团队写到：

2022年5月，arXiv上每天平均新增516篇论文……科学数据的增长速度更是比人们的处理能力快……一个人已经不可能读完特定研究领域的论文。搜索引擎不直接组织信息，维基百科这样的形式需要人力来维护，研究人员持续为信息过载感到不知所措。

因此他们提出，语言大模型可以更好的存储、组合和推理科学知识，并提出一个终极愿景：

神经网络将成为科学研究的下一代人机界面，就从这篇论文开始。

本意是好的，而且Galactica的表现也确实不错。

除了文本、数学公式、代码任务之外，它还可以执行化学式、蛋白质序列等多模态任务。

Galactica 1200亿参数版本在许多科学类任务上性能超越OpenAI的GPT-3、DeepMin的Chinchilla与Gopher、以及开源的BLOOM。

然鹅，测试基准毕竟是死的，一旦进入生产环境开放给用户，还是会出现开发时预料不到的情况。

问题出在哪？

在Hacker News上有人认为，语言模型终究是在“对语言建模”而不是对内容。

就像AI绘画模型一样，你让它画“骑马的宇航员”它就能画出来，虽然这不太可能发生，但是很有趣。

类似的讨论也发生在Twitter上。如果你让AI生成一篇关于“生活在太空的熊”的维基页面，AI也会试着生成。

有人认为，不，AI需要判断出这个要求不合理。

关键就在于，人们对图片和文字的要求是不一样的。

图片中的内容不合理，人们只会觉得有趣而接受。而文字的内容错了，那就不可接受。

LeCun则认为这种工具的用法应该是辅助驾驶，它不会帮你写好论文，只是帮你在过程中减轻认知负担。

【相关文章】

★ 瑞典科学家Svante Pääbo获诺贝尔生理学或医学奖

★ AI PIN概念股大幅走高奥海科技等多股涨停

★ 科学家颜宁父亲：全力支持女儿回国颜宁父亲是做什么的

★ 击败申真谞陪练的围棋AI，却输给业余人类棋手 | MIT&伯克利研究

★ 12月2日上线无望！马斯克再次推迟蓝V认证功能发布时间

★ 马斯克抵制＂苹果税＂迎来盟友：获Spotify、Epic Games CEO声援

★ 硅谷寒冬！Meta疯狂裁员11,000人，毕业生该怎么办？

★ Meta三季度营收277亿美元同比降4% 净利44亿美元同比下滑49%

★ 银保监会、央行：要加大动产和权利融资服务力度

★ AI也需要睡觉?研究发现:AI在睡眠后学习力可媲美人脑

标签：大模型推特论文 ai meta

THE END

本文地址：https://www.qubaike.com/hotnews/93zdx0hn.html

声明：本文信息为网友自行发布旨在分享与大家阅读学习，文中的观点和立场与本站无关，如对文中内容有异议请联系处理。

热点阅读

小莫溞麦mp3试听(小莫烧麦歌曲在线播放)

2023-03-22

ippa010054水印编号(ippa010054女主角是谁)

2023-03-23

西子TMC至尊全智太阳能测控仪操作说明书太阳能tmc西子至尊全天候测控仪

2023-03-25

娱乐718sx传送门(718st王大炮)

2023-03-22

啄木鸟全部女星介绍啄木鸟女星叫什么名字

2023-03-25

求一个看钙片的网址资源网站都是在哪找的?

2023-03-22

凌憋小便上舞蹈课体罚迟到了脱鞋打脚心

2023-03-26

sana合集提取码(sana八部小合集)

2023-03-22

Meta大模型成了“科学造假发动机”，发布3天就在争议中下架

热点阅读

小莫溞麦mp3试听(小莫烧麦歌曲在线播放)

ippa010054水印编号(ippa010054女主角是谁)

西子TMC至尊全智太阳能测控仪操作说明书太阳能tmc西子至尊全天候测控仪

娱乐718sx传送门(718st王大炮)

啄木鸟全部女星介绍啄木鸟女星叫什么名字

求一个看钙片的网址资源网站都是在哪找的?

凌憋小便上舞蹈课体罚迟到了脱鞋打脚心

sana合集提取码(sana八部小合集)

最新推荐

为您推荐

百科工具箱

Meta大模型成了“科学造假发动机”，发布3天就在争议中下架

热点阅读

小莫溞麦mp3试听(小莫烧麦歌曲在线播放)

ippa010054水印编号(ippa010054女主角是谁)

西子TMC至尊全智太阳能测控仪操作说明书 太阳能tmc西子至尊全天候测控仪

娱乐718sx传送门(718st王大炮)

啄木鸟全部女星介绍 啄木鸟女星叫什么名字

求一个看钙片的网址 资源网站都是在哪找的?

凌憋小便上舞蹈课 体罚迟到了脱鞋打脚心

sana合集提取码(sana八部小合集)

最新推荐

为您推荐

百科工具箱

西子TMC至尊全智太阳能测控仪操作说明书太阳能tmc西子至尊全天候测控仪

啄木鸟全部女星介绍啄木鸟女星叫什么名字

求一个看钙片的网址资源网站都是在哪找的?

凌憋小便上舞蹈课体罚迟到了脱鞋打脚心