9月26日,正式发布的《学术出版中的AIGC使用边界指南2.0》(以下简称《指南2.0》)进一步细化了AI工具辅助论文写作的指导和规范。
《学术出版中的AIGC使用边界指南2.0》
虽然《指南2.0》等文件对于在一定限度内使用AIGC辅助写作论文的行为表示了认可,但同时也强调了在学术研究到出版发行的过程中,所有应用功能使用者都应该了解并明确披露AIGC在其工作中的使用情况。近两年也多见滥用AI工具撰写论文的案例报道:以Retraction Watch持续更新的ChatGPT论文专栏为例,目前网站已经记录了92篇被确认在未声明的情况下使用ChatGPT写作的论文和2篇被证实由ChatGPT过度参与的同行评审内容。
来源:retractionwatch.com
在同行评议平台PubPeer上查看这些论文的质疑详情可以发现,其中大部分被质疑内容都存在来自ChatGPT的标志性短语(“Certainly! Here is…” / “Regenerate Response”),通常是由于作者一时疏忽把生成的内容和相关提示语一并粘贴进正文,从而被发现端倪。但相较于这种易于辨认的AI论文,当使用AI的作者更加“仔细”或是采用更为取巧的生成和改写方式时,又该如何及时发现这类不端行为呢?
上图:在PubPeer平台被指出含有ChatGPT典型句式和标签的论文及同行评审
下图:某改写网站的语句转换实测(详见:折磨句子)
借助检测系统筛查论文中是否存在AIGC文本不失为一个有效预防相关学术不端行为的好办法。《指南2.0》同样为AIGC产生内容的检测和发现提出了相关建议,并重点强调:期刊和编辑在使用新的工具来检测和识别由AIGC产生的内容时,务必注意安全性,防止信息泄露和数据被不当利用。因此,对AI检测工具的选择同样需要做到维护自身权益、认准权威机构、防范风险、减少花销。
万方文察-AIGC检测系统依托万方科研诚信服务平台,选用注意力机制模型架构,结合预训练大语言(含大量学术文献)文本识别深度学习模型, 以及自然语言处理技术,利用神经网络的强大表达能力,判断人机生成文本之间的差异,从语言模式和语义逻辑对中、英文本进行深度分析,从而实现对AI生产内容的精准识别。
服务入口:科研诚信服务平台首页-AIGC检测系统
AIGC检测系统在精准识别AI生产内容的同时,基于其系统操作过程的便利及输出结果清晰的特性,能够快速完成对学术出版社、期刊编辑部的论文出版审查环节,或是院校对学科作业、毕业论文、学术成果类文章的AIGC检测等需要对大量文本进行集中检测的工作并批量输出检测结果:
1. 提交论文方式多样:
①本地上传&粘贴文本:可以上传本地论文文件,也可手工录入
②单篇检测&批量检测:允许一次上传多篇论文
2. 结果列表一目了然:
检测结果可筛选,检测信息可导出,检测进度易追踪,检测报告可在线查看&下载。
3. 检测报告清晰可视化:
检测报告包括在线报告和pdf下载报告,结果指标清晰,片段分布图展示全文疑似AI生成文本的概览情况,提供疑似AI生成文本的检测详情。
虽然目前论文AIGC检测的技术已经趋于成熟且开始得到广泛应用,但是和论文查重系统类似,不同检测系统所采用的算法,或送检过程中的细节因素都有可能导致AIGC检测系统最终输出的结果存在客观层面的误差。因此,AIGC检测结果作为辅助判断依据,在实际应用中还需要根据论文的使用范围、期刊的要求、论文整体水平等综合研判处理。
AIGC检测系统:
https://cx.wanfangdata.com.cn/aigc-check