随着人工智能生成技术的发展,学术剽窃等不端行为已经不是简单的搬运行为。为避免AI在大学生学习中的滥用,目前国内多个研究团队都在推动AI生成内容识别技术的发展,以技术治理技术。
近日,央视新闻就这一问题采访了相关学者及研究团队,并报道了万方数据与北京邮电大学鄂海红教授团队合作取得的科研诚信检测技术相关成果。鄂海红教授重点介绍了对科学实验中运用AI工具进行图片造假等行为的反识别研究以及相应千万量级图片库的建设情况。
以下视频来源于
央视新闻
万方数据与北京邮电大学鄂海红教授团队共同构建的比对库目前已收录超过400万篇的SCI的期刊论文以及超过6000万张图像数据。在此基础上,团队设计的学术论文图像复用检测算法在确保检测查准率的前提下,能够识别裁剪复用、形变复用、旋转复用等多种通过算法方式编辑他人的学术图片、改造实验结果的不端行为。该技术目前已正式在万方数据论文智能察验服务投入应用,可实现篇内图片相似性检测与全库图片比对。
图片检测实例:Pubpeer平台质疑某论文复用图像详情
https://pubpeer.com/publications/D5DAFDF59A92C40C3468D61DF6AF5E
该论文图像比对结果(部分)
来源:万方数据文察图像检测服务
此外,一些学生和专家也提醒,AI工具主要由自身捕获的海量信息对所提出的需求进行智能分析,但这些信息的真实性和准确性可能存在缺陷,从而得出错误的结论或出现幻觉问题。例如通过大模型协助查找和生成文献时,AI工具可能会基于自身获取的数据进行拼接,虚构参考文献列表,而并非在期刊中查找相关文献(详见:幽灵文献)。
在采访的最后,专家再次强调:作为人类的助手,人工智能技术在日常生活中可以很好协助完成一些工作。但是在专业领域的研究过程中,参与研究人员都应该做到以我为主,充分发挥我们自己的想象力、能动性和创造力。
相关推荐--论文科研诚信风险综合筛查
万方数据论文智能察验服务-文察
面向论文学术不端治理需求,万方数据论文智能察验服务集先进的算法模型、强大的数据资源底座为基础,通过一站式综合服务,实现对论文文本相似性、图像复用、AIGC风险、引文及作者等多要素的一次提交,多维检测。帮助教育、科研、出版、管理等诚信监管机构及早发现风险线索并采取相应的措施。
服务入口:
https://cx.wanfangdata.com.cn/verification