欢迎来到中细软旗下技术转移平台

服务热线：400-700-0065

技术转移平台

节能环保新能源新材料高端制造生物产业数字创意

承认、道歉、删除！斯坦福AI团队抄袭中国大模型

2024-06-054414来源：

近日，斯坦福大学AI研究团队的Llama3-V开源模型因抄袭指控被推上风口浪尖。该模型被指涉嫌抄袭清华系明星创业公司面壁智能开发的开源模型“小钢炮”MiniCPM-Llama3-V2.5，这一事件迅速在网络上引发广泛关注和热议。

　　近日，斯坦福大学AI研究团队的Llama3-V开源模型因抄袭指控被推上风口浪尖。该模型被指涉嫌抄袭清华系明星创业公司面壁智能开发的开源模型“小钢炮”MiniCPM-Llama3-V2.5，这一事件迅速在网络上引发广泛关注和热议。

　　据悉，5月29日，斯坦福AI团队发布了一个名为“Llama3-V”的模型，声称只需要500美元（约合人民币3625元）就能训练出一个SOTA（State of the Art，即最先进的）多模态大模型，效果比肩 GPT4-V、Gemini Ultra 、 Claude Opus ，但模型小100倍。

　　公开信息显示，Llama3-V团队的其中两位作者 Siddharth Sharma 与 Aksh Garg 是斯坦福大学计算机系的本科生，曾发表过数篇机器学习相关的论文。名校背景，特斯拉、SpaceX等大厂经历的成员，再加上号称足以“改变现状”的研究成果，Llama3-V受到了相当程度的关注。Llama3-V不仅在社交媒体上迅速蹿红，还一度冲上了HuggingFace趋势榜首页（机器学习领域中较有影响力的平台，其趋势榜一定程度反映出模型的流行度）。

　　然而，不久后，网友便发现该模型的结构和代码与面壁智能的“小钢炮”模型存在高度相似性，除了部分变量名外，几乎完全一致。

　　6月2日晚，面壁智能团队确认了这一抄袭事实。他们指出，斯坦福的Llama3-V模型不仅能够识别出“清华简”中的战国古文字，而且连错误的识别结果都与他们的MiniCPM模型一致。这些古文字数据是面壁智能团队花费数月时间从清华简上逐字扫描并人工标注的，且从未公开过。

　　面对抄袭指控，斯坦福Llama3-V团队的两位主要作者Siddharth Sharma和Aksh Garg在社交平台X上向面壁智能团队和公众道歉。他们承认了自己的错误，并承诺将撤下所有Llama3-V模型。这一道歉信在发布后不久被删除，但随后他们再次发布了类似内容的道歉信，表明了他们对此次事件的重视和决心。

　　6月3日，面壁智能CEO李大海及其联合创始人刘知远相继公开发声，就他们公司的开源模型被斯坦福大学AI团队疑似抄袭的问题作出了回应。

　　李大海在声明中表达了对此事的深切遗憾，并指出，尽管从某种程度上看，这种模仿可以被视为他们的成果得到了国际团队的某种认可，但他更强调应该构建一个开放、协作且充满信任的技术社区环境。他进一步强调，他们希望团队的努力和优秀工作能够吸引更多人的关注和认可，但并非以这种被模仿甚至抄袭的方式。

　　面壁智能首席科学家、清华大学长聘副教授刘知远也表示，人工智能的飞速发展离不开全球算法、数据与模型的开源共享，让人们始终可以站在SOTA的肩上持续前进。面壁开源的MiniCPM-Llama3-V 2.5就用了最新的Llama3作为语言模型基座。而开源共享的基石是对开源协议的遵守，对其他贡献者的信任，对前人成果的尊重和致敬，Llama3-V团队无疑严重破坏了这一点。他们在受到质疑后已在Huggingface删库，该团队三人中的两位也只是斯坦福大学本科生，未来还有很长的路，如果知错能改，善莫大焉。

　　同时，这一事件也提醒我们，在全球化的学术和开源环境中，保护知识产权和维护学术诚信同样重要。

　　中细软集团深耕知识产权行业23年，在知识产权服务的实践中赢得生存与发展，成为成就知识产权服务的专业品牌。中细软集团已成长为同行业中具有影响力的元宇宙科技创新服务平台，服务项目多达3000余种。致力于通过网络科技等手段，为全球科技创新提供系统的解决方案与信息服务。您有任何知识产权相关问题，欢迎找我们咨询。

　　来源：海峡网、站长之家、第一财经