斯坦福AI团队致歉面壁智能:Llama3-V模型将悉数撤下

斯坦福AI团队致歉面壁智能:Llama3-V模型将悉数撤下

WechatIMG72_meitu_1

今日,就斯坦福AI团队主导的 Llama3-V 开源模型被证实套壳抄袭国内清华&面壁智能的开源模型“小钢炮”MiniCPM-Llama3-V 2.5一事,迎来终局。

斯坦福 Llama3-V 团队的两位作者 Siddharth Sharma 和 Aksh Garg在 X 上就这一学术不端行为对面壁 MiniCPM 团队正式道歉, 表示会将 Llama3-V 模型悉数撤下。相似内容的道歉信,已于几小时前被作者发出一次,但被迅速删除。

5月29日,一个斯坦福团队发布Llama3V项目,并宣称500美元即可训练出一个多模态大模型,效果比肩GPT-4V、Gemini Ultra、Claude Opus等。凭借着低廉的价格、优秀的团队背景,上述模型发布的推文在X平台(推特)获得了较大关注。

大量关注下,随即被眼尖的网友发现,Llama3V项目与面壁智能最新发布的多模态模型MiniCPM-Llama3-V 2.5“雷同”。面对越来越多的抄袭“质疑”,斯坦福团队也从最初的“狡辩”,变成了“删库跑路”。

6月2日深夜,面壁智能团队证实,该斯坦福大模型项目与MiniCPM一样,可以识别出“清华简”战国古文字,“不仅对得一模一样、连错得都一模一样”。且这一古文字数据为研究团队花费数月从清华简上逐字扫描并人工标注得来,并未对外公开,证实抄袭事实。

针对此事,知乎CTO、面壁智能CEO李大海表示:我们对这件事深表遗憾!一方面感慨这也是一种受到国际团队认可的方式,另一方面也呼吁大家共建开放、合作、有信任的社区环境。

对于“抄袭”行为本身,面壁智能方面也给出了补充介绍。

李大海介绍到,“经过团队核实,除了社区网友列出的证据外,我们还发现 Llama3V展现出和小钢炮一样的清华简识别能力,连做错的样例都一模一样,而这一训练数据尚未对外公开。这项工作是团队同学耗时数个月,从卷帙浩繁的清华简中一个字一个字扫描下来,并逐一进行数据标注,融合进模型中的。更加tricky的是,两个模型在高斯扰动验证后,在正确和错误表现方面都高度相似。”

经历此事,李大海不无感慨,“
技术创新不易,每一项工作都是团队夜以继日的奋斗结果,也是以有限算力对全世界技术进步与创新发展作出的真诚奉献。我们希望团队的好工作被更多人关注与认可,但不是以这种方式。”

亲爱的凤凰网用户:

您当前使用的浏览器版本过低,导致网站不能正常访问,建议升级浏览器

第三方浏览器推荐:

谷歌(Chrome)浏览器 下载

360安全浏览器 下载