今年,有关使用生成式 AI 引发的新型科研不端行为已多次被各种报道反复提及。前不久《柳叶刀》副主编 Sabine Kleinert 表示,“最近几个月,编辑们在编辑待发表论文的参考文献时,发现有数字对象识别码(DOI)却无法检索到对应的引用文献,说明这些引用是虚构的‘幻觉式引用’。”同行评议平台 PubPeer 也指出,今年收到的论文、书籍引用假文献的线索大幅增加,这种现象同样与 ChatGPT 等生成式大模型的兴起密切相关。
6 月,据网站 Retraction Watch 报道,由 Springer 出版的专著Mastering Machine Learning: From Basics to Advanced(精通机器学习:从基础到进阶)中很多引用指向的文献根本不存在。经出版社后续调查发现,全书共 46 篇参考文献里有 25 篇文献无法核实来源。最终这本书在官网的书名和每一章的标题都被标记为“已撤回”,并在章节中加入了对专著的撤回声明,列出了 25 篇未能核实的文献详情。Springer 出版社也在其博客上发表了题为《书籍中的研究诚信:通过平衡人类监督与人工智能工具实现预防》的文章。强调今后 Springer 将在整个出版过程中紧密陪伴作者、编辑和审稿人,着重通过执行最高的伦理和诚信标准以确保书籍内容真实可靠。


期刊收录的论文也不乏“幻觉式引用”的情况。11 月 13 日,发表在期刊 DARU : journal of Faculty of Pharmacy 的文章《对发表后同行评审平台的专家批评:以 PubPeer 为例》称类似 PubPeer 等平台因其开放性“易被滥用”,容易导致过度怀疑和批判行为的增加。

随后这篇文章就被 PubPeer 平台批判了:文章的 17 条引用里包括 5 篇不存在的文献、3 篇文献的 DOI 或链接错误,以及 1 篇已撤稿文献。随后网友发现这篇文章不仅有“幻觉式引用”的问题,还存在语言重复、不同段落内容与结构几乎一致的情况,具有典型的 AI 生成文本特征。

在 PubPeer 的评论区,有人通过提示词让 ChatGPT 再次生成了与文章引用的虚假文献几乎一致的引文信息,指出 AI 工具完全能够根据用户需要虚构用于佐证文章观点的文献。虽然论文作者在致谢中声明“用 AI 工具辅助部分语言编辑,但发表前已审核内容”。不过无论从文章的引用情况还是遣词造句来看,显然作者并没有像自己声明的那样仔细阅读并核实了文章内容,AI 工具也深度参与了这篇文章的创作。

“GPT 可以按需(重新)发明这份出版物”
“幻觉式引用”并非近期才出现的一种学术不端现象。2023 年 9 月,文章《ChatGPT 生成书目引用中的伪造和错误》即研究探讨了 AI 工具可能生成虚假文献的这一特定幻觉。无论是 GPT-3.5 还是 GPT-4 在生成的文档中都存在近半数的错误引用或虚假引用,其中包括捏造引用文献、对真实文献信息的实质性引用错误(文章标题、作者姓名、来源等),以及引用格式错误的情况。即便自文章发布至今的两年间 AI 技术已经得到大幅进步,从近期的相关事件可以看出,AI 工具在查找获取文献方面依然存在明显不足。

作者在文章中强调,ChatGPT 本质上不是信息处理工具,而是语言处理工具。它更擅长依照用户需求模仿自己信息库中的相关文本风格输出内容,这些内容则不一定都真实有效。尤其对于引用这种特殊类型的文本而言,大语言模型的预测性用词、改写等相关技巧可能引起更大负面效果。例如,当 AI 在生成文本时用一个更常见甚至更恰当的同义词替换标题中的某个词,会降低标题作为搜索字符串以及作为特定引文作品独特标识符的价值。
Springer 出版社在编辑政策和图书出版政策中也多次提及已知 AI 模型会抄袭内容并制造虚假内容,作者应进行尽职调查,确保其书中的任何 AI 生成内容正确、引用适当,并遵循相关标准。无论哪种 AI 参与写作的情况,作者都必须对文本最终版本承担人为责任。尽管目前各出版社都在积极采用技术手段并完善人工审核流程对 AI 内容加以识别,对于虚假文献、引文相关性和引用错误等对参考文献的多维度识别也是目前相关工具探索的重点,但作者对 AI 工具的正确认知、明确其使用边界、加强相关诚信教育才是守护学术真实性底线的根源问题。
相关阅读:
付费墙和马太效应:AI 研究科学文献还存在哪些困境?
当 AI 作者向十四位审稿人发送了一篇论文
AI 赋能科研之规范、技巧与工具系列讲座
[1] 《柳叶刀》副主编:这类信件,我们一律拒稿 - 中国科学报 / 科学网
https://news.sciencenet.cn/htmlnews/2025/10/554251.shtm
[2] Springer Nature book on machine learning is full of made-up citations - Retraction Watch
https://retractionwatch.com/2025/06/30/springer-nature-book-on-machine-learning-is-full-of-made-up-citations/
[3] RETRACTED BOOK: Mastering Machine Learning: From Basics to Advanced - Springer Nature
https://link.springer.com/book/10.1007/978-981-97-9914-5
[4] Research integrity in books: Prevention by balancing human oversight and AI tools - Springer Nature
https://www.springernature.com/gp/researchers/the-researchers-source/safeguarding-research-blogpost/research-integrity-scholarly-books/27780154
[5] An expert criticism on post-publication peer review platforms: the case of pubpeer - DARU Journal of Pharmaceutical Sciences
https://link.springer.com/article/10.1007/s40199-025-00580-z
[6] An expert criticism on post-publication peer review platforms: the case of pubpeer - PubPeer
https://pubpeer.com/publications/5CC4D1FB2B21DBB3D50E3DFDAE2543
[7] Fabrication and errors in the bibliographic citations generated by ChatGPT - Scientific Reports
https://www.nature.com/articles/s41598-023-41032-5#Sec1
[8] Book Publishing Policies - Springer Nature
https://www.springernature.com/gp/policies/book-publishing-policies