小偷?MiniCPM-Llama3-V 2.5与Llama3-V剽窃之争


咋一看:MiniCPM-Llama3-V 2.5与Llama3-V 好像只是版本不同,是的,Llama3-V只是在MiniCPM-Llama3-V 2.5上修改一下,然后就作为升级版本发布,这两个都是开源,外行人以为是抄袭剽窃,有的网友不以为然,开源3.0版本在开源2.5版本基础上做些很少修改,有什么问题吗?这是炒作吗?

原文点击标题:
震惊!斯坦福大学一个团队的 Llama3-V 项目大量剽窃 MiniCPM-Llama3-V 2.5!
其代码是对 MiniCPM-Llama3-V 2.5 的重新格式化,模型的行为与噪声版 MiniCPM-Llama3-V 2.5 检查点高度相似。
证据:https://github.com/OpenBMB/MiniCPM-V/issues/196

各位 MiniCPM-Llama3-V 2.5 项目作者们,前几天我发现了一个令人震惊的事实,llama3-V(https://github.com/mustafaaljadery/llama3v)项目中有大量作品疑似从 MiniCPM-Llama3-V 2.5 项目中窃取而来,而我在 llama3-v 的 GitHub 项目 Issue 中提出了我的质疑,没有想到 Llama3-V 的作者们很快就删除了我质疑的帖子,并且隐藏了 Llama3-V 的 Huggingface 项目页面。

我强烈质疑他们的所作所为,接下来我会公布全部证据,并恳请大家关注这个事实。该 Issue 已经被 llama3-V( https://github.com/mustafaaljadery/llama3v ) 的作者删除,我会公布全部证据,揭露 llama3-v 的作者们就是一群小偷的事实!

网友:这里“小偷”定义有点道德幻觉,充斥情感谴责,因为即使证据显现,也需要第三方评判,即使“抄袭者”默认,也不能冠以“小偷”,特别是在开源Github上,复制粘贴代码已经是程序员的"抄袭"习惯了

参与推广者道歉:
关于 Llama3V:首先,我们要向 MiniCPM 的原作者道歉。我们希望由Mustafa 发表原声明,但从昨天开始一直无法联系到他。 @siddrrsh 和我与 @mustafaaljadery 一起发布了 Llama3V。Mustafa 编写了该项目的代码。

  • 我们在这里的角色是帮助他在媒体和 twitter 上推广这个模型。
  • Sid 和我查阅了最近的论文,以验证这项工作的新颖性,但我们并不知道或不了解 @OpenBMB 之前的任何工作。

我们向作者表示歉意,并对自己没有尽职验证这项工作的原创性感到非常失望。

我们有责任将我们的工作与过去的研究进行比对,但我们没有做到这一点,因此我们对所发生的一切负全部责任。

今后,@siddrrsh 和我会更加谨慎和勤奋,我们衷心感谢社区提请我们注意此事。为了尊重原作,我们已经删除了所有对 Llama3V 的引用,并再次表示歉意。

网友认为:
1、如果从道德高地看,这是不可饶恕的,这封道歉是不够的,轻描淡写,只是强调自己核实工作不力。

  • 如果你们只是推广工作,就不能把所有责任都推到一个人身上。

2、这三位都是斯坦福大学本科生,本着爱好兴趣,以及复制粘贴的习惯,推动了版本升级,虽然大家都理解了最新论文内容,也有心将这些创意落地到Llama3V,但是真正编码者在落地编码时,也许搜索到了已经在MiniCPM-Llama3-V 2.5实现,都是Llama3家族,本着世界程序员一家项目亲的原则,就改了改就地取名升级,效率很高。

3、但是没有强调2.5原创,不过3.0版本肯定是基于2.5原创,这种默认软件版本传承可得不到外行人承认。抄袭剽窃=小偷 逻辑推理正确。

4、堂堂斯坦福大学竟然抄袭中国清华系的作品,看来,中国的大模型在世界上被忽视了。

5、这件事很长中国人志气,我们不应该一直这么自卑,以至于过分敏感。

6、看来人类的幻觉不比大模型的幻觉和欺骗能力差。