1引言
正值全国集中精力大战新冠病毒之时,教育部、科技部于2020年2月联合发出《关于规范高等学校SCI论文相关指标使用树立正确评价导向的若干意见》[1](以下简称“意见”)的通知,科技部发出《关于破除科技评价中“唯论文”不良导向的若干措施(试行)》的通知[2](以下简称“措施”),两份文件的密集发布足以说明,目前中国的学术评价体系已到了非改不可的紧要关头,这不仅关系到科研的健康发展,而且关系到包括抗疫在内的各行各业如何实施创新型国家战略的大问题。
从近期各大媒体和网络报道看,多数专业人员充分肯定两份文件的大方向是正确的,但也有一些质疑或担忧[3-6]。如有人认为,如果不以SCI论文为直接依据,那么新的评价形式又是什么?它是否比现有的评价体系更好呢?废除一个旧有的规则很简单,但是建立一个新规则更加关系重大。没有谁比学术界的人更想破除唯SCI论的现状,但是改变之后呢?基础研究不发论文,用什么来评价?不唯国外论文和国际期刊了,国内期刊能堪大任吗?什么是高质量的论文学术,论文成果只发表在国内高水平期刊,中国的科研水平就一定会提升吗?SCI并不完美,但它是目前“最公平”的评估方法。学术评估是有成本的。作为一种低成本的评估方法,SCI应该占有一席之地。许多其他评估方法,不仅成本高昂,而且难以确保它们是公平的。唯SCI论不可取,但是,在没有更好的替代方案实施之前,就取消了SCI论文相关指标的使用,很有可能是弊大于利。目前尚未建立完善的学术考核体系,SCI突然退场,或许会损害到高校教师的相关利益。还有人认为,SCI也包含“同行评议”,这与文件中倡导的“同行评议”有何异同?引入SCI与当时国内学界的同行评价制度不完善有关,而目前,同行评价仍然无法获得学术界的一致认可。从这些观点中可以看出,尽管在两份文件中,对何为“SCI至上”、其危害以及如何建立新的评价系统等有简要的叙述(如分类评价、代表作制、定性定量相结合的综合评价方式等),但仍有相当多的专业人员对“SCI至上”的危害与根源,对新的评价体系已建构多年但执行不力等情况并不清楚,亟须详细阐述。
为了准确、完整地认清SCI的功能,应对以上的质疑和担忧,本文从专业的角度,利用概念分析法、SCI创始人观点的案例比较法,详述SCI的产生、发展和其功能,剖析“SCI至上”的要害和根源何在,何为新的评价体系的框架,目前学界、科研管理部门及广大专业人员目前应该如何从自身做起,等等,以供同行和决策部门参考。
2“SCI至上”的要害是将形式评价等同于内容评价
SCI至上是将引文及其衍生指标人为地提升为评价学者、成果、机构等的硬性、前置性、甚至为唯一的标准。比如,硬性规定博士研究生必须发表几篇在SCI来源期刊上发表的文章才能授予学位;临床医生、工程技术等应用型人才也必须有一定数量的SCI论文才能评聘高级职称,而不论其实践知识多少和实际贡献有多大;学术期刊的影响因子越高其质量越好,在高影响因子期刊上发表的论文都是高质量、高水平的;研究成果被引用次数越多,其质量、水平越高;只要在SCI来源期刊上发表论文,不论其观点如何,论证怎样,大学等机构在SCI来源期刊上发表论文越多,被引用越多就越好,如此等等。SCI至上直接导致了良莠不齐的学术论文激增,而研究质量没有同步提高,抄袭、造假、急功近利等学术不端行为和浮躁学风蔓延,严重扭曲学术研究的初衷和使命。那么从引文学理上看,SCI至上要害到底是什么?回归引文的含义、特征、SCI创立的过程和各种观点的碰撞、交流,也许可以找到这个问题的答案。
早在1955年,SCI的创始人尤金·加菲尔德(EugeneGarfield)博士就在Science上发表了有关科学文献引文索引的文章,1963年SCI问世,大约10年以后,SCI的年度累积本才被正式出版。SCI产生,不仅是信息检索领域的一大创新,而且是文献计量学、科学计量学、科学社会学等学科史上具有里程碑意义的事件。美国著名科学社会学创始人罗伯特·默顿(RobertK.Merton)于1983年在为SCI创始人加菲尔德的著作《引文索引法的理论与应用》撰写的序言中写道,“他所建立的系统能够提供各种元素,以系统地反映科学家的著作之间的联系,因为这种联系既可以用于检索文献,又可以用于探讨科学中的认识层面与社会层面的相互关系”[7]。SCI问世的50多年的实践已经证明默顿的独特眼光,SCI不仅有独特的文献检索作用,而且有文献统计与分析科学的社会结构与文化结构的作用。这两大作用在国内外学术界已获得共识,几乎没有争议。但是对于是否具有“评价”作用、具有多大的评价作用,则争议颇多。
早在SCI诞生的1963年,针对利用引文计量数据有可能作为评价个体科学家和研究经费的主要或决定性依据,加菲尔德先生预先明确发出警告,“在科学社会学评价方面,包括学术人员的挑选和研究经费的分配,不能滥用和粗心地使用定量引文数据”,“影响与重要性不是一回事。个人发表的论文数量与其工作质量或重要性之间没有特定的关联”,“盲目地得出被引用次数最多的作者就应该获得诺贝尔奖的结论是荒谬的”[8]。尽管加菲尔德先生也强调过,“其一,它(被引频次所测度的性质)是一种对质量的肯定,一般反映对有关科研工作的承认。其二,它在同行意见的形成过程中扮演着重要的角色。这两个特征是从大量研究中获得的,这些研究显示被引频次与同行评议之间存在着强烈的正相关”[9];“基于引文统计的质量判断与诺贝尔奖委员会所做的判断二者之间的相关性非常强”[9]。同时他指出,“我们仍需谨慎从事,仍需弄清引文统计作为相对的科研绩效评测的局限性……引文计数的简明性掩盖了与引文统计相关的不少敏感性问题。忽略这些敏感性问题的肤浅的引文研究,往往会严重误导别人”[9]。可见,SCI的创始人早在几十年前就对SCI的评价作用进行了适当的定位:被引数据与同行评议(peerreview)有很强的正相关性,但“数据”本身并没有包含具体、丰富的内容(如引用的是何概念、方法、观点等),从这个意义上说,实际上仍是数字的“形式”的评价(尽管数据的来源是同行作者的引用),不等于同行评议的直接针对“内容”的评价,否则都会产生误导。
从中还可以看出,他认为引文数据可以帮助同行专家进行直接的内容评价。同行专家需要利用专业知识对引文数据导引出的内容进行周全而精微的分析和判断。换言之,SCI对科学家的评价有部分辅助作用,但不是“主要的或决定性的”作用。
“SCI至上”的要害是“绝对化和形式化”,是混淆形式评价与内容评价、辅助评价与主要评价之间的界限,抹杀二者的差别。其表现在SCI来源期刊和引文数据方面的“至上”就非常明显。
SCI来源期刊是根据“布拉德福分散定律和加菲尔德集中定律”[9]、为了编制经济和效率的理由而筛选出来的。在SCI诞生的早期(20世纪70、80年代),其来源期刊“大约有3000种”[9],大约占实际所有科技学术期刊的20%。世界上到底有多少种科技期刊,加菲尔德博士曾说,“没有人能够知道到底总共出版多少种期刊,因为对构成期刊的条件众说纷纭,莫衷一是”[9],认为各种目录、统计数据不一。笔者曾于1993年专门探讨过这一问题。通过考证各种期刊目录和一些靠谱的期刊数据,推算出当时的科技期刊约6万种[10]。近20多年来。科技期刊,尤其是开放存取期刊(openaccessjour‐nals)增加不少。据报道,著名报刊目录《乌利希国际期刊指南》(Ulrich’sPeriodicalsDirectory)目前收录200多个国家的15万种期刊[11](恐翻译或理解有误,15万种里包括不定期连续出版物)。据目前负责SCI来源期刊的科睿唯安(ClarivateAnalyt‐ics,原汤森路透知识产权与科技事业部)网站报道,WebofScience核心文献与多个区域性引文索引、专利数据、专业领域的索引以及研究数据引文索引,总计收录超过33000种学术期刊[12]。而2019年JCR(JournalCitationReports,期刊引用报告)收录期刊11877种。SCIE、SSCI和AHCI分别收录9200、3408和1829种(有些期刊同时被SCIE、SS‐CI两个数据库收录,故有重复计算)[13]。但不论SCI来源期刊是过去的3000种,还是目前的1万多种,它们只是所有学术期刊的一部分期刊。尽管这些来源期刊的筛选是依据一些定量与定性的标准及指标筛选出来的,绝大多数来源期刊的质量是不错的,但是,并不是所有的好期刊都在来源期刊里。由于SCI来源期刊筛选采取的是申报制,如果一种期刊质量很好,但它因为各种原因不申报,那么该刊就不会是SCI来源期刊。又由于SCI是美国人编制的,来源期刊侧重于英文期刊,德、法、西班牙等西文的期刊在来源期刊中比例不高,中文等期刊比例更少。就是说非英文的质量好的一些期刊未必是SCI的来源期刊。因此,将SCI来源期刊至上,即只认在SCI来源期刊上发表的成果才算绩效,在其他好期刊上发表成果都不被承认,显然,这是不对的。此外,来源期刊至上还表现在它无视同一种来源期刊上众多论文质量不同的事实,如硬性规定,凡是在同一种期刊上的发文一律享受同样的奖励待遇。笔者团队曾研究非来源期刊、非核心期刊发文情况,研究结果表明,非来源期刊、非核心期刊中有不少质量好的论文,而不少来源期刊、核心期刊中不乏一般性论文[14]。2009年第三次到中国访问的84岁高龄的加菲尔德先生在回应相关提问时也强调,“尽管这篇文章发表在很好的期刊上,比如《自然》、《科学》,它可能永远没被人引用过,而这些期刊上很多一般的文章也只被引用过几次,
而只有少数文章引用是特别多的。所以引用期刊影响因子来评估每个人的科研表现和科研能力,包括他个人的评估、奖金也好、赞助也好都是不合理的”[15]。综上,这些都说明将SCI来源期刊“至上”是站不住脚的。
点击获取原文查看全部原文内容