IT之家 4 月 13 日消息,据澎湃新闻报道,北京智源人工智能研究院回复谷歌大脑的著名科学家 Nicholas Carlini 对一项中外合作大型学术论文涉嫌剽窃的指控称:“我们已经注意到对《A Roadmap for Big Model(关于“大模型”的路线图)》一文的质疑,正在对相关情况进行核实,智源研究院鼓励学术创新和学术交流,对学术不端零容忍,有关进展将尽快通报。”
此前 4 月 8 日,这篇数十位国内 AI 大牛参与论文被指严重抄袭,Nicholas Carlini 公开撰文,指控一篇于今年 3 月 26 日刊登在论文预印网站 Arxiv 的论文《关于“大模型”的路线图》(A Roadmap for Big Model)一文涉嫌严重抄袭。
该文是前不久国内外多家高校和企业共同完成的长达 200 页的学术综述论文,有多达 100 名作者,分别来自于清华大学、北京大学等国内高校,哥伦比亚大学、蒙特利尔大学等国外高校,字节跳动、华为、京东、腾讯等企业以及中科院和北京智源等机构。
Nicholas Carlini 在文章《机器学习研究中的一个抄袭案例》(“A Case of Plagarism in Machine Learning Research”)中则详细列举了该论文存在大段抄袭其他论文的嫌疑,证据是大规模的文本重叠,疑似被剽窃的论文也包括他自己的论文“Deduplicating Training Data Makes Language Models Better”。
此前 3 月 31 日,北京智源社区撰文以《如何炼大模型?200 页 pdf100 + 位作者 19 家单位!北京智源清华唐杰等发布》介绍该篇论文:“随着以深度学习为代表的 AI 技术的快速发展,智能模型的训练应用模式逐渐由‘大炼模型’向‘炼大模型’转变。大模型研究在近年来发展迅速,模型的参数量以惊人的速度扩展。北京智源人工智能研究院最近发布的《A Roadmap for Big Model》由悟道大模型研究项目负责人,智源学术副院长,清华大学计算机系教授唐杰牵头,从大模型基础资源、大模型构建、大模型关键技术与大模型应用探索 4 个层面出发,对 15 个具体领域的 16 个相关主题进行全面介绍和探讨。非常值得关注。”
IT之家了解到,Nicholas Carlini 也在其博客中表示:“很可能只有少数作者参与了这种抄袭,一小部分作者的不当行为不应该被用来指责大多数行为良好的作者。”
本文由LinkNemo爬虫[Echo]采集自[https://www.ithome.com/0/612/798.htm]