《Science》2025 年的一则报道,将全球学术不端的疮疤再次揭开。萨里大学《科学报告》副编辑、统计学家马特・斯皮克直言:“我收到了很多几乎相同的论文——一天一篇,有时甚至是两篇”。NHANES 公开数据集的数据显示,2023-2025年间创作的低质量论文数量相较以往激增47%。论文工厂已形成“数据获取-AI生成-期刊投稿”的完整产业链,而科研评价体系中的“唯论文”导向正是滋养这一生态的土壤。
来源:www.science.org
中国学术界同样面临这场由“论文工厂”与 AI 技术合谋制造的学术危机:职称晋升考核论文数量、项目申请要看发表论文的期刊级别、绩效考核也看论文发表记录——正是这套评价体系催生的巨大压力,逐步催生了论文工厂的产业链。
在此背景下,以“以考代评”为核心的科研评价改革正式破局,旨在建立更科学的学术评价标准。
职称评审机制重构:从“数论文”到“论实绩”
改革首刀直指职称评审体系,通过标准化考试与实绩导向打破固有困局。
初中级职称实现“应考尽考”
2025年4月,浙江省卫健委发布的改革文件明确:医、药、护、技四大类初中级职称将全面纳入全国统一考试范畴,实行“统一命题+三年成绩有效期”制度。这一举措从源头上终结了“论文数量论英雄”的潜规则。
高级职称评审“临床硬实力”领跑
北京某三甲医院试点方案显示,高级职称评审中临床病案权重已提升至60%,SCI 论文仅限报2篇成果代表作。申报者须提交主诊疑难病例完整诊疗记录、创新术式视频及患者随访数据。这种以工作成果为重心导向让临床医生重新聚焦“治病救人” 核心价值。
考试内容精准“靶向设计”
医学类考试新增“科研诚信与数据规范”模块,重点考核数据真实性验证、学术不端识别等实操能力;工程类考试引入“技术转化案例分析”,要求结合专利转化实例答题,考题设计与“应用研究重贡献”的评价导向形成精准呼应。
代表作制度落地:让核心成果“站 C 位”
在改革关键支点从“论文清单”到“代表作举证”的转变下,申报人参与考核仅需提交1-5项最能体现学术水平的成果。对于不同领域,考核所需成果各有侧重:
基础研究人员可侧重高水平论文、学术专著
应用研究人员与工程师以专利、技术标准、工程项目为核心
临床医生突出疑难病例诊疗、手术视频、新技术应用
教师聚焦教学成果、教材编写、教改项目
这种“一人一策”的评价模式,让每个领域的核心价值得到精准衡量。
给不同学科定制“分类评价标尺”
科研评价改革针对不同研究领域特性,通过构建差异化评价体系,终结评价“一刀切”弊端。
基础研究领域:“长周期 + 里程碑”护航原创
2024年,上海启动“基础研究先行区”,推行“选人而非选项目”模式,由战略科学家主导遴选,对优秀研究者提供无固定年限的长周期稳定资助,为高风险、高价值基础研究“松绑”。国务院国资委2025年明确提出,对5-10年重大基础研究项目设置“里程碑节点评价”,建立宽容失败机制。
应用研究领域:“转化实绩”说了算
应用研究领域实行专利转化“双轨制”评价,将专利实施后3年的经济效益(如企业新增产值)与技术标准制定贡献(如纳入行业规范)作为核心指标。明确科技转化成果、专利发明奖项可替代一定篇数的论文要求,让“实验室到生产线”的转化能力成为硬指标。
人文社科领域:“社会影响力”成新标杆
人文社科领域将创新建立“社会影响因子”评价体系,对政策咨询报告、非遗保护方案等成果按采纳层级(国家级/省部级)折算分值。某省社科院试点“学术成果图谱”,通过可视化呈现研究者理论演进脉络;部分高校参考澳大利亚“研究影响评估框架”,增设“公众理解度”指标,将纪录片收视率、科普书籍再版次数等纳入评价。
改革深水区:从“破唯”到建立新评价坐标系
国际学界对中国科研诚信的关注,已从个案质疑转向制度观察。放眼全球,德国洪堡基金会有“成就档案”制度,将代表作扩展至科研项目设计、学术会议报告等多元形式;澳大利亚有“研究影响评估框架”,对人文社科成果增设“公众理解度”指标,如纪录片收视率、科普书籍再版次数等。中国这场改革的深意,远不止于替代论文数量考核,也是在探索构建“质量可量化、贡献可追溯”的新型评价体系;决定中国科研能否在全球学术治理中完成从“问题应对者”到“规则制定者”的蜕变。
今后,临床医生的价值可以由治愈患者数量定义;基础研究者可以骄傲自己的理论成就突破而不是期刊的级别;各行各业以核心成果和实际业绩来衡量级别与功绩——论文工厂的生存土壤自然会日渐贫瘠。
斩断论文工厂链条非一日之功,但“以考代评”的改革方向已然明确:让科研回归探索本质,让评价尊重学科规律,这片学术土壤终将重现健康生机。
万方数据科研诚信服务平台,通过打通学术科研活动“事前-事中-事后”全链条覆盖的科研诚信建设与学术不端治理闭环的产品服务体系,赋能诚信学术与负责任科研行为。