北大青年研究 -- 杂志首页

2022年第3期

过往期刊

2022年第2期
2022年第1期
2021年第4期
2021年第3期

编委会

封面题字： 杨　辛
主办单位：北京大学
顾　问：王义遒　林钧敬　张　彦
编委会主任：陈宝剑
副主任：陈占安徐善东王逸鸣

户国栋
委　员(以姓氏笔画为序)：
王天兵王艳超冯支越　匡国鑫　
孙华关海庭陈建龙　刘卉　

刘海骅宇文利吴艳红李杨

陈征微金顶兵　查　晶　祖嘉合

夏学銮蒋广学　霍晓丹　魏中鹏
刘书林(《思想理论教育导刊》常务副主编)
杨守建(《中国青年研究》副主编)
彭庆红(《思想教育研究》常务副主编)
谢成宇(《学校党建与思想教育》社长)

屈晓婷(《北京教育（德育）》副主编)
夏晓虹(《高校辅导员》常务副主编)
周文辉(《学位与研究生教育》社长)
李艺英(《北京教育（高教）》社长)
郑　端(《思想理论教育导刊》编辑部主任)
陈九如(《高校辅导员学刊》副主编)
毛殊凡(《中国高校社会科学》总编室主任)
主　编：王艳超
编　辑：许凝马丽晨朱俊炜
王剑吕媛李婷婷
李涛侯欣迪杨晓征

宋鑫张会峰陈秋媛

马博陈珺茗陈卓
审校：青年理论办公室

深化新时代高校人文社科科研评价体系改革

作者：何宛玲发布日期：2021-01-24

摘要：文章通过重点研究人文社科科研评价中的“五对关系”：标准化评价与分类评价的关系、定量评价与定性评价的关系、独立研究成果与跨学科合作成果的关系、学术性成果与智库性成果的关系、国际化与本土化的关系，分析当前我国高校人文社科科研评价体系存在的制度性缺陷，探讨深化新时代高校科研评价改革的未来路径。

关键词：高校；人文社科；科研评价；改革

2020年是一个特殊的年份——不仅是“双一流”建设第一期的验收之年，也是全国第五轮学科评估和学位授权点专项评估的启动之年。2020年10月，中共中央、国务院印发《深化新时代教育评价改革总体方案》，明确指出应改革高校科研评价，突出学科特色、质量和贡献，提出了坚持分类评价、淡化量化指标、推行代表性成果评价、完善同行评议机制、探索长周期评价、注重个人评价与团队评价相结合等措施。

那么，高校科研评价体系应如何发挥好风向标、指挥棒的作用？如何构建一个中国特色、中国风格、中国气派的人文社科科研评价体系？本文将通过重点研究人文社科科研评价体系中的“五对关系”，深入探讨新时代下高校人文社科科研评价的改革路径。

一、人文社科科研评价的定位与特色

人文社科科研评价是一种对于科研产出的价值判断，旨在认识、理解和展示学术研究的影响，以及对于提升国家学术竞争力、创造财富和社会福利的价值^[1]。人文社科科研评价通常是指对于科研成果的评价，但如今其外延已扩展至学术研究所产生的潜在影响，例如研究对于人才培养、经济发展、社会进步、文化传承等方面的影响。

一方面，人文社科与理工医科的科研评价存在着明显的区别：人文社科更注重政治性和学理性相统一，强调扎根中国大地；文献计量法的应用局限性相对较大；成果类型更为多样，除论文外，专著、编著、译著、创作成果等都可能具有重要的学术价值或文化价值；人才成长周期、成果产出和影响周期更长；国际化程度不同，更注重本土特色、民族特色与区域特色。

另一方面，“新文科”与传统文科的科研评价也存在差异：“新文科”鼓励立足时代需求、创新研究方法、拓展研究领域；更强调学科交叉与团队合作，打破传统文科以独立研究、小工作坊为主导的模式；更重视学科服务国家战略需求、推动经济社会发展、提升公众文化素养的功能。

二、高校人文社科科研评价中的“五对关系”：问题与反思

（一）标准化评价与分类评价的关系

科研评价日益成为世界各国对于高等教育进行问责的重要手段，许多国家已针对高校建立起了统一的、制度化的评价体系。然而，不同学科、不同类型教师的内在发展需求差异，对标准化的评价范式提出了新的挑战。

一些国际学科评估试图通过建立分类指标体系来解决此问题。QS学科评估根据细分学科的特色赋予了不同的指标权重：在“学术声誉”指标上，人文学科占比较高，例如古典学、艺术与设计占比高达90%，英语、语言学和表演艺术占比达80%；而理工医科的“学术声誉”占比仅为30%—40%。在“h指数”和“篇均引用”指标上，人文学科的占比较低，大多在10%以下；理工医科占比约20%—30%^[2]。在泰晤士高等教育世界大学评价的“论文引用率”指标权重上，人文与艺术仅为15%，社科类为25%左右，理科、医科、心理学则为35%^[3]。

全国第四轮学科评估设置了人文、社科、艺术、管理等大类体系，但这种区分更多是“粗放式”的，整体性指标过于泛化，二级与三级指标设置、权重分配上难以充分体现各学科的特点。第五轮学科评估按照一级学科进行了指标体系设计，但开放性程度依然不够。除了“标准化评价”以外，标准化的结果呈现方式也是科研评价的另一大问题。“排名”与“等级”或许是科研评价最直观的展现方式，但也可能导致学科评估异化为一种扭曲的资源分配效应，形成固化的学术权力结构，甚至使各高校陷入无序竞争的状态，偏离了“以评促建”的初衷。

（二）定量评价与定性评价的关系

在人文社科领域，文献计量学显得有一些“水土不服”。例如，期刊影响因子仅有两年的时间窗口，难以体现人文社科成果的长周期影响；同时，一本期刊上可能仅有少部分论文获得了高频次的引用，从而提升了刊物的影响因子值。另外，引用数量的多少也不一定能反映成果本身的水平，综述型文章、争议较大的文章常常会获得更多的引用，“刷数据”等行为也可能使得学术风气变得日益浮躁。

国际评估通常采用定性评价与定量评价相结合的方式，其中定性评价主要通过“学术声誉调查”来开展。在QS、THE、US News的世界大学评估中，定性与定量科研评价指标所占权重比值分别为2、0.47和0.45。根据2019年的一项全国问卷调查，理工科教师对于学术声誉指标的赞同程度为62%，人文社科教师对于学术声誉指标的赞同程度为70%—80%^[4]。

我国高校人文社科的量化评价在实践过程中已经遇到了很多问题。一方面，不同类型成果的分值权重存在如何确定的问题，尤其是论文与专著的权重分配问题。例如，根据南京大学人文社科科研评价方案，具有重要学术影响的学术译著视同为学术专著，可折合为一流期刊成果1篇，或CSSCI期刊成果2篇；国家级重大文献整理工程项目出版的成果视同学术专著，可折合为一流期刊成果1篇，或CSSCI期刊成果2篇。然而，这种量化的折算方式也引起了诸多争议。一部好的学术专著，可能需要8—10年或更长时间的积累，远超过单篇论文的简单叠加。高校青年人才面临“非升即走”的压力与“慢工出细活”之间的权衡，是选择以短平快的论文发表为主，还是选择长周期的研究工作，与当前的评价机制导向密切相关。

另一方面，同一类型的成果还存在不同级别的分值如何确定的问题。教育部在学科评估中也曾有过遴选“A类期刊”的尝试^[5]，但由于各方异议较大，最终未能实行。第四轮学科评估引入了代表性论文评价，但依然保留了师均被SCI、SSCI、EI、A&HCI、CSCD、CSSCI等收录的论文数量、出版学术专著数量等。第五轮学科评估推动了进一步改革，规定专家评价时不得以“论文引用”等计量指标为主要依据，要求凝练出5项标志性学术论文成果，并简述原创性、前沿性、突破性创新内容和学术贡献。“代表作评价”制度在校内职称评审方面也逐渐被许多高校所接受，北京大学、清华大学、南开大学、复旦大学、中国人民大学等都在该制度上进行了充分探索。

不过，主观性较强的“代表作评价”与“同行评议”也存在许多亟待解决的难题。在学术成果已公开发表的情况下，“双盲评审”实际上成为了“单盲评审”，同行评议能否很好地规避人情和利益关系带来的干扰，也取决于评审制度设计是否健全，以及学术共同体是否已经形成了相对成熟的规范。我国高校人文社科科研评价在此方面依然任重而道远。

（三）独立研究成果与跨学科合作成果的关系

与自然科学的“团队攻关”作战模式相比，人文社科学者可能更偏向于“单打独斗”。然而，传统文科的思维理念已逐步被“新文科”建设需求所冲击，学科交叉与融合成为了人文社科的最新学术生长点，需要盘活各类学术资源、汲取多种学术给养、形成优势学术集群。然而，目前我国的人文社科科研评价机制依然存在一定的惯性，还未能完全适应学术合作与跨学科发展的前沿趋势。

许多国家已在科研评价中采取了一系列的改革措施。英国在“科研卓越评估框架”中成立了“跨学科研究评估咨询小组”，所有分评议组至少有两名成员被任命为跨学科顾问。当分评议组的所有成员都不具备特定学科领域的专业知识时，可将成果“交叉推荐”至其他分评议组。对于多人合作成果，各高校可以提交“双倍权重”申请，在合作者证明其实质贡献后，同一成果可重复计算两名教师。此外，“科研环境”评价部分专门列入了衡量“学术合作成效”的定性评价指标，旨在促进不同高校之间的科研合作，各机构需要阐述其学术合作网络和伙伴关系的有效性、联合研究项目的成功案例等^[6]。在欧洲青年研究员奖励评审中，跨学科研究具有“双重机会”——涉及两个门类的跨学科研究，可同时由两个评议组进行审议，最终被分配至得分更高的评议组^[7]。在德国联邦科学基金会资助的“特殊研究领域”跨学科项目评审中，评审专家进行长达两天左右的现场考察和评估，并采取了会议评审、公开辩论、交流讨论等多元化的形式^[8]。

在我国人文社科科研评价体系中，“双一流”评估一般根据教师的归属来判定成果归属。第五轮学科评估规定仅获奖成果、支撑平台可拆分至多个学科和完成单位，而代表性论文、著作、教材、专利、艺术实践成果等均不可拆分。代表性论文也仅限“第一作者”和“通讯作者”单位填写。一方面，论文的作者排序在一定程度上可以反映出作者的贡献程度；但另一方面，论文合作者的贡献常常被忽视，特别是在跨学科研究领域，每一位合作学者可能都作出了独特的贡献。

我国高校内部的跨学科研究评价与管理机制也有待进一步完善。正如朱道本院士所言，“如果是几方不同学科的人一起完成的研究课题，单纯强调第一作者，那一开始合作就要打架，因为一开始谈，文章是谁第一，或者轮流第一，但是轮到对方时，好的结果就不提供了，这势必造成矛盾”^[9]。以北京大学为例，尽管学校政策明确允许不同院系之间的双聘、多聘，但新设的跨学科机构可能面临老体制教师原所在院系的阻力，难以在科研成果归属、工作量计算与考核评价等方面达成共识，因此在一定程度上削弱了相互合作的意愿。

（四）学术性成果与智库性成果的关系

大学的传统边界一般以人才培养和科学研究为主，而智库研究与社会服务则处于从属性的地位。但实际上，学术性成果与智库性成果并非二元对立的关系。好的智库研究一定是以好的学术研究为基础，而好的学术研究也需要好的智库研究来提供扎根中国大地、服务经济社会的关键抓手。

我国的学科评估主要在“社会服务”领域纳入了智库性成果维度，但允许提供的代表性案例数量非常有限，也难以很好地体现出智库研究与学术研究的互动。英国“科研卓越评估框架”的“科研影响力”指标则规定智库性成果所依托的学术性成果可在科研产出部分重复提交，且在质量评估中至少能得到二星级，从而大大增强了智库研究与学术研究之间的联动性。

在高校教师的考核评价方面，多数高校以学术研究成果作为职称评审的主要指标，智库研究与社会服务成果仅作为辅助性、边缘性指标。也有一些高校采取了将智库性成果与学术性成果进行“定量挂钩”的方式，例如，获得领导人肯定性批示、转化为政策文件的成果可按照一定的比例折合为不同级别的期刊论文成果，但这种简单折算的方式也引起了许多学者的反对。而清华大学、复旦大学、武汉大学、浙江大学等高校正在尝试建立智库研究系列岗位的新型评价机制，与教学科研岗位教师的评价标准进行区分。北京大学尚未设置专门的智库研究系列，不同的人文社科院系根据自身情况采取了不同的评价与激励措施：约有57%的院系未将智库研究纳入科研绩效奖励范围；19%的院系将智库研究纳入了科研绩效奖励总体范围，但未针对智库性成果制定专门的评价政策；24%的院系专门针对智库性成果制定了评价与激励政策。总体而言，我国高校在平衡学术性成果与智库性成果的关系、提升评价标准的科学合理性方面还有待进一步探索。

（五）国际一流与本土特色的关系

与理工医科相比，人文社科具有鲜明的本土性、民族性和区域性特色。人文社科受到了特定历史语境、地理区域、经济情况、文化背景、社会结构等方面的影响，因此很难形成国际统一的评价体系。一味迎合国际期刊感兴趣的研究领域、迎合欧美设定的学术标准，可能会导致本土理论与表达范式的衰落，催生一种新的“文化帝国主义”。正如香港中文大学杜祖贻教授所言，“一旦甘愿放弃科研评价的责任，便将永远无法获取学术批判的能力与自信，也难以有足够的智慧与勇气去从事真正具有创造性的科研工作”^[10]。

我国的学科评估一直面临着“国际一流”与“中国特色”之间的抉择。第四轮学科评估保留了师均被SCI、SSCI、A&HCI等国际数据库收录的论文数，但要求代表性论文里的中国期刊论文不得少于1/3。第五轮学科评估作出了进一步改革，将“三报一刊”理论文章纳入研究成果，并规定代表性论文里的中国期刊论文不得少于1/2。不过，严苛的数量标准也引起了一些质疑：一些老师认为代表性论文需要留出足够的自主选择权，不同学科的中国期刊比例限制也应该有所区别。此外，能否反映“中国特色”，不应当以“是否发表在中国期刊上”作为唯一衡量指标，而要看论文本身的研究内容及其对中国的实际价值。在国际平台上传播中国声音、讲好中国故事亦是一种“中国特色”，因此不宜做出简单化、“一刀切”的规定。

三、高校人文社科科研评价体系的未来改革路径

第一，完善分类评价模式。在标准化评价框架的基础上强化分类评价，进一步采取精细化的管理模式，充分尊重不同学科发展和不同学者成长的内在规律；对于基础类研究，注重长周期、标志性成果的贡献度和影响力；对于应用类研究，侧重评价其在服务国家和区域战略需求、解决经济和社会发展问题上的能力；对于特色学科“量身定制”评价办法，加强对于小众学科的保护，关注“冷门绝学”、涉密类学科等；进一步扩大“留白指标”的比例与空间，鼓励增设个性化的评价指标；淡化排名意识，采取评价结果“多维展示”思路，开拓“特色榜”等形式，对于不同单项情况进行分层分类宣传，让各高校在不同方面拥有获得感，找到适合自身的发展定位。

第二，完善客观数据支撑的小同行、代表作评价模式。进一步扩大“代表作评价”范围，允许提交更为多样的学术成果或创作成果，鼓励主体性、原创性和引领性的研究，体现瞄准学术前沿和自由探索的导向，对于间接的、长远的、隐性的价值予以更多关注；合理衡量定量评价在不同学科的适用程度，对于特定领域可采取定量评价作为辅助手段，为主观评价提供客观参考；建立健全动态调整、持续更新的国内外学术小同行专家库，完善评审专家遴选机制，优化专家年龄结构，适当扩大专家数量，打破“熟人政治”圈；完善监督与保障制度，科学研制评价指南，利用统计学手段对评价结果“信度”进行研判，严格落实举报、调查和惩戒机制。

第三，完善跨学科合作成果的评价模式。改变以“竞争”为主导的学科评估思路，探索引入“学术合作”方面的定性评价指标，增强各高校、各机构之间的合作动力；拓展跨学科成果的认定范围，纳入更多类型的代表作成果；进一步创新“学科归属度”的认定方法，完善专家抽查惩戒机制；改革跨学科项目与成果评审方式，采取会议评审、公开辩论、双向交流等多元化形式，必要时延长评审时限，给予不同学科学者充分沟通信息的时间与空间；探索交叉学科领域的单独评价模式，推进“交叉学科类”奖项评审、“交叉科学部”项目评审、交叉学科门类评估的不断优化；加强跨学科期刊建设，打造跨学科领域提供学术评价、整合学科资源、形成学术流派的枢纽性平台；完善跨学科研究的校内评价与管理机制，妥善解决院系与机构之间在成果评价、绩效评估等方面存在的分歧，根据特殊情况予以灵活的政策调整。

第四，增强学术研究与智库研究之间的互动性。智库研究应当根植于学术研究，并反哺于学术研究。对于与智库研究联系较为紧密的学科，应考虑适当加大智库性成果指标权重，同时在定性指标中进一步体现学术性成果与智库性成果的关联性；适当增加智库性成果典型案例数量，提升案例丰满度，为主观评价提供充足的参考依据；构建多维度的智库性成果评价标准，克服“一把尺”评价的局限性；在高校内部探索智库研究系列或应用实践系列岗位管理模式，采取“双轨制”“多轨制”评价机制；设立智库类奖项与基金，在相关院系与机构评估中纳入智库工作评价维度，形成正向激励效应。

第五，注重国际一流与本土特色有机统一。充分尊重人文社科学术研究中的民族性、地域性和本土性特色，重视文明的传承、发展与创新；对于国际化程度相对较高的学科，可探索引入国际小同行评价机制，参考部分国际可比性指标；进一步细化和完善代表性成果的中国期刊比例要求，在判定“中国特色”时不唯期刊论，而应具体考察成果的研究主题、研究内容和研究影响；提升我国人文社科学术期刊的国际影响力，鼓励有需求的期刊积极申请国际刊号，与国外优质教研机构、出版社等合作，不断增强在世界学术评价体系中的话语权。

四、结语

评价制度是学术发展与学科建设的指南针和活性剂，具有方向引领、价值判断和动力催生的作用。一流的人文社科科研评价体系应当在配置学术资源、塑造学术文化、维护学术环境等方面发挥出关键作用，充分顺应学科生长的自然规律，营造出富于生命活力的学术生态。深化科研评价机制改革、提高科研评价质量效率、增强科研评价公信力，将有助于构建具有中国特色、中国风格、中国气派的人文社会科学学术体系、学科体系、话语体系，为中国的发展与进步提供更多的新知识、新思想、新理论和新方案。

作者简介：何宛玲　北京大学社会科学部干部　研究实习员

参考文献：

[1]Reale E, Avramov D, Canhial K, et al. A Review of Literature on Evaluating the Scientific, Social and Political Impact of Social Sciences and Humanities Research[J]. Research Evaluation, 2018, 27(4): 298-308.

[2]QS Intelligence Unit. QS Methodology, Key Metrics & Weightings [EB/OL]. http://www.iu.qs.com/university-rankings/subject-tables/, 2020.

[3]Times Higher Education. World University Rankings by subject[EB/OL]．https://www.timeshighereducation.com/world-university-rankings/by-subject, 2020.

[4]蒋林浩,陈洪捷,黄俊平.人文、艺术和社会学科评估指标体系研究——基于对大学教师的调查[J].华南师范大学学报:社会科学版, 2019(2):52-61.

[5]教育部学位与研究生教育发展中心.关于全国第四轮学科评估补充事项的函 [EB/OL].http://fgc.fjnu.edu.cn/_upload/article/files/9e/1e/2fa6de374bd7a17f9810520144b9/aa92adbd-d471-4974-96bd-4bddb3a51db5.pdf, 2016-05-06.

[6]Research Excellence Framework 2021. Panel criteria and working methods (2019/02) [EB/OL]．https://www.ref.ac.uk/publications/panel-criteria-and-working-methods-201902/, 2019.

[7]Langfeldt L, Brofoss K. Evaluation of the European Young Investigator Awards Scheme[EB/OL]. https://nifu.brage.unit.no/nifu-xmlui/bitstream/handle/11250/282958/NIFUSTEPArbeidsnotat2005-10.pdf?sequence=1&isAllowed=y2005.

[8]Grit L. Conclave in the Tower of Babel: How Peers Review Interdisciplinary Research Proposals[J]. Research Evaluation, 2006(1):57-68.

[9]魏巍,刘仲林.国外跨学科评价理论新进展[J].科学学与科学技术管理, 2011(04):20-25.

[10]杜祖贻.借鉴超越:香港学术发展的正途[J].比较教育研究,2000(5):1-4.