“双一流”建设成效评价的本源追问

2022年01月16日浏览次数：[]

摘要：以专业的眼光看，“双一流”建设成效评价的有效性与大学评价的根源性有关，需要从本源上对评价对象、评价目的、评价内容和评价方法进行再辨与反思。在评价对象上，“双一流”建设成效评价意在教育事实，理应满足教育的基本规律；在评价目的上，“双一流”建设成效评价旨在成人与创新，必须遵循人才与学术的根本逻辑；在评价内容上，“双一流”建设成效评价重在内隐文化，应当关注文化的传承与积淀；在评价方法上，“双一流”建设成效评价涉及综合的技术手段，无疑需要高度的专业判断。

关键词：教育评价；建设成效；“双一流”建设

《深化新时代教育评价改革总体方案》的出台为业界全面检视与理性反思大学教育评价的顽瘴痼疾、多方探寻并着力形塑中国大学教育的“一流”之道提供了重要契机。相关研究的起始逻辑大体有二。一是从技术层面探讨大学教育测评的工具及操作问题，如测评标准是否妥当，指标设置是否合理，度量方式是否科学，等等；二是从管理层面深究大学教育评价的政策及制度问题，如评价政策如何引领，评价制度如何完善，评价机制如何运行，等等。在简要回望大学评价的过往历程并粗略前瞻来日的教育评价趋势之后，可以看出，大学教育评价的根本性问题早已不能简单地归结于工具与方法层面上的技术操作问题，也难以笼统地停留在政策与制度完善等行政治理问题；从更深层次看，还有诸多基本的认识问题有待于澄源，如教育活动的根本属性、学术研究的本体价值、大学组织运行的内在机理等。无疑，后者才是大学教育评价活动的本源性问题，也正是我们理性审视与深刻领会当下“双一流”建设成效评价的内在机理和逻辑起点。我们只有将这些处于教育评价逻辑链上端的问题弄清楚，在不同利益相关者之间，尤其是教育管理层中达成理论共识、情感共鸣和价值共振，才能更好地端正“要不要评”“为谁评”“谁来评”“评什么”“用什么评”“如何评”等技术性问题，进而促使变幻无常的大学教育评价摆脱纠结、趋于稳健。为此，需要从本源上对“双一流”建设成效的评价对象、评价目的、评价内容与评价方法进行深一步的辨析。

一、自然事实抑或教育事实：评价对象的澄明

澄明评价对象是“双一流”建设成效评价的基本前提。直观上看，“双一流”建设成效评价自然是对“双一流”建设及其成效所作出的评价，指向明确，对象清晰，不用澄明亦无须赘述。但深究其中，对“双一流”建设成效评价对象的澄清无疑还隐藏着一些更为关键的且亟须回答的问题，如这一“专项建设”是一项特殊性的另类工程还是一项普适性的教育活动？“建设成效”是一个指标性的客观结果还是文化性的教育过程？“成效评价”是一种依托工具指陈的事实判断还是基于事实关系的价值判断？等等。对这些问题的回答显然离不开对评价对象的实践查验与理论澄明。从实践上来看，“双一流”建设成效的评价对象复杂且多元，既包括大楼、大树、大师、学校、学生、学科、学业以及人才培养、研究成果、服务产出、文化载体等看得见摸得着的、客观存在的自然事实，也涉及校园风貌、历史底蕴、文化氛围、师生关系等看得见摸不着或看不见也摸不着的、有而不在的教育事实；而从理论上分析，“双一流”建设成效的评价对象简明且单一，在本源上是一种教育事实。“一流大学”与“一流学科”离不开一流的教育且应最终落实为一流的教育。“双一流”建设成效评价在根本上是一种教育评价，是对教育活动或教育现象及其构成要素，即教育事实的评价，这是教育常识亦是评价常态。教育事实不同于自然事实，它是一种带有价值性（真、善、美）的特殊事实。一方面，就其内容而言，教育事实既可以是客观的社会事实及外在的自然事实，也可以是主观的价值事实及内在的文化事实。另一方面，相比自然事实对于客观结果的强调，教育事实更为注重实践及生命成长的过程，聚焦于教育过程中物对人的价值和人对人的影响。

与之相应，作为对教育事实的评价，“双一流”建设成效评价至少需要满足以下两大规定：一是评价理应回到教育自身。从专业、科学的视阈看，当下正在发生的“双一流”建设成效评价虽然同教育相关，但无论是教育主管部门所实施的外部评价，还是第三方机构所做出的专业测量，甚至大学内部的各级管理者所开展的自我评估，都并非单纯地指向于对教育自身的评价。在“双一流”建设成效评价中，尽管评价主体有所不同（如利益相关者、中立者、社会“看客”等），“不同的评价主体与教育现场的距离远近有所不同”^［1］（既有在场的，也有准在场的甚至不在场的），但他们所处的教育评价立场却大都位于教育过程之外。这就难免把教育等同于教育的附属之物或派生产物，如教学业绩、研究成果、服务产品等，并将其作为评定教育的依据，这就不可避免地使得理论上的教育发展评价简化为现实中的教育结果评价，其仅与教育相关，而非针对教育自身。事实上，教育就其自身而言是一种趋向真善美的培养、影响或干预活动，在本质上是一系列的实践过程而非既定结果，在时序上亦是先有过程而后有结果。当下的各类大学教育评价过分强调教育结果而有意无意地忽视了教育过程，难免事倍功半。二是回到教育自身的评价在根本上是一种价值判断。与对自然事实的评价判断不同，对教育事实的评价需要事实判断但不能止于事实判断，还应涉及更高层面的价值选择。仔细辨析，对自然事实的认识在本质上是一种认知活动，归属于认识论范畴；对价值事实的认识才是评价活动，归属于实践论范畴；而对教育事实的认识，不仅是一种认知活动，更是一种实践活动，不仅需要从认知领域来理解，更需要在实践层面来把握。其中的关键在于是否涉及价值判断，教育评价的根本特性和显著特点均聚焦于此。事实判断的对象偏重客体，价值判断的对象关注主体，换言之，教育评价是一种倾向于主体的判断。因此，“双一流”建设成效评价不但要指陈客体性的事实，更要诠释主体性的事实，关注主客体之间、主体与主体之间的价值关系，并需要对主客体的存在及属性的一致性进行评判。

二、塑造成材抑或发展成人：评价目的的反思

“双一流”建设成效评价如期展开，但评价目的仍需适时反思。《“双一流”建设成效评价办法（试行）》明确规定了评价目标，指出建设成效评价须遵循“一流目标，关注内涵建设”的原则，旨在“加快‘双一流’建设，促进高等教育内涵式发展、高质量发展”，“推进高校及其学科在具有可比性的领域进入世界一流行列或前列”。在深层的评价哲理之中，评价目标从属于评价目的，是评价目的的具体表现与外在形式。相比外显、细化的评价目标，评价目的更为内隐、更为本源，从根本上规定并支配着一切评价活动。“双一流”建设成效评价若要真正落到实处并取得实效，不仅要符合评价目标的外在要求，更要满足评价目的的内在规定。从目的视角看，“双一流”建设成效评价旨在发展一流教育和培养一流人才。换言之，国家正是为了发展一流教育和培养一流人才，才做出了建设世界“一流大学”和“一流学科”的战略决策。显然，在“双一流”建设过程中，一流教育和一流人才比一流大学和一流学科更为根本、更为关键，构成了“双一流”建设成效评价的根本标的。“双一流”建设成效评价作为对教育事实的评价，其评价目的自然要遵循教育之根本目的，并满足教育之根本任务。众所周知，教育的根本目的在于“成人成己”，其根本任务在于“立德树人”。所成或所树之人是拥有喜乐之心、纯真之情、进取之志，有血有肉、有情有欲的自由人，“是努力实现个人社会化和个性化和谐共进的完整人，是不断追求知识寻真、道德向善和生活审美的完满人，是持续超越自我、成就自我和提升生命质量的生命人”。^［2］“成人”既是一流教育的核心内容，也是一流人才的前置要件。只有先成“人”，才可能成“才”（注意：不是“材”），进而成就一流。

“成人”的目的导向必然要求“双一流”建设成效评价的重心在“人”，而不在“物”或“材”，应做到以人为本、目中有人，不能见物不见人或重取材而轻育人。成人与成材不同，成材遵循的是外在的塑造逻辑，有既定的、现成的模型可依，而成人遵循的则是内在的发展逻辑，无固定的、预成的模式可循。佛家有言：佛在心中，由己不由他，人皆有觉解之途、成佛之道。同理，大写的“人”既不是预成的，也不是建成的，而是生成的，是在适宜的环境中自己长出来的。尽管“成人”的方法、态势与路径因时因境因人而各有不同，但其实现可能及跃升之途无不掌握在自我手中。“双一流”建设作为一项成人的事业，其目标能否达成以及目的能否实现，既不由教育行政部门所决定，也不受第三方鉴定组织干预，而在根本上取决于大学自身。与按照一定标准所评选出的“一流大学”与“一流学科”不同，一流教育不是评价出来的，一流人才也不是建设而成的，一流教育和一流人才终究离不开处于教育现场的学校组织与师生个体之间的持续作为与相携共长。从理论上来看，一流大学和一流学科的建设及塑造逻辑同一流教育和一流人才的生成及发展逻辑存在着微妙的矛盾和张力。在现实的教育实践中，两者之间的矛盾和张力可以转化，亦可调和。

继“211”和“985”工程之后，“双一流”建设就是一个新的政策范畴及工作促进系统，旨在从管理层面为高等教育的改革与发展提供新一批次的政策支撑。从政府的立场上看，“双一流”建设作为行政治理的话语方式，遵循着项目制的建设逻辑或塑造逻辑，本无可厚非，就学校管理及教育治理而言是必要的、可行的且有效的。然而，如若将这一政策概念引入到教育领域并落实到复杂多样的大学场域而不对建设话语作任何转换，则势必会因场域不适而导致政策概念的泛化、异化与失真。教育行政部门的政策概念及建设话语只有转化为大学自身的教育概念及发展话语，才能保持教育的独立性，进而促进良好教育生态的形成。为此，在“双一流”建设成效评价中，教育主管部门需把满足行政要求、受效率主导的、自上而下的考核范式转化为符合教育规律、受效益支配的、平等合作的对话范式，大学组织自身则需要把来自政府部门的成材期望、建设话语及塑造逻辑有效转化为符合大学与学科发展要求的成人规定、发展话语及生发逻辑，方可有助于建设目的的达成。

三、外显指标抑或内隐文化：评价内容的诘问

评价内容是“双一流”建设成效评价的重心所在，值得诘问。评价内容事关建设方向，有什么样的内容标准及评价规定，就有什么样的建设要求及办学导向。在专项建设过程中，一流教育实践的开展及造就一流人才的目标达成，离不开卓尔不群的文化熏陶。大学的灵魂在于文化，一流大学的评价自然少不了对一流文化的关注。有学者把“双一流”分为指标上的和文化上的两个层面，并认为指标层面的“双一流”是“功利主义的产物，以竞争而非合作为

目的”，是人为建构而成的，而文化层面的“双一流”“以构建人类命运共同体为己任，具有一定的高度和宽度，高度上‘求善’，宽度上‘求同’”，是自然演化而来的，才是真正意义上的“双一流”。^［3］据此，相关评价当然就不能仅仅停留在外在的、浅显的指标考核上，而应立足于内在的、深层的文化体验上，对大学文化及其育人成效的评价理应成为“双一流”建设成效评价的核心内容。正如人不仅是自然性存在，更是社会性和文化性存在，教育作为“成人”之事，其本质乃是一种文化的实践，发展成人不仅需要个体生命的自然展开，更离不开个体生命同社会文化的鲜活互动。教育与文化之间的紧密联系决定了“双一流”建设成效评价与文化密不可分，在根本上是一种文化评价。“双一流”建设作为一项政策实践，必然置身于一定的社会现实和文化环境之中，与之相应，成效评价作为一种检验手段，愈发需要植入具体的情境元素并做出文化考量。在“双一流”建设实践中，我们只有扎根中国大地，立足中华传统文化，注入中国元素，凸显中国底色和中国魅力，才能办出特色，继而实现“中国特色，世界一流”的建设目标。

文化的表现形态各异，但究其本质则是特定群体与一定社会生活方式的有机融合。任何一所大学所具有的独特文化，均是这所大学中的师生们对其独特生活环境的适应方式，是他们在长期的教育实践与社会生活中自觉或不自觉选择、有意或无意取舍的历史性积淀。从文化的视阈看，世界一流大学与一流学科的生成是一个缓慢的、长期的过程，需要扎根于特定的文化土壤并经过漫长的历史演进才能逐渐“生长出来”。当然，在政府的主导下，各高校通过对标对策、应情应景，寻找捷径、搭乘快车，抑或能够在短期内实现“弯道超车”而建成“一流”，但这种“一流”往往表现在简单、外显的指标层面，无非数字上的“一流”而已。“双一流”的指标化的建设模式在短期内或许奏效，但从长期看依然难以规避边际效益递减的命运。中国的“双一流”建设若想取得实效并可持续发展，就必须实实在在地注重大学文化的建设与评价，从指标拼杀转向内涵演进。尽管耗时耗力，终究不失稳妥。事实上，经过第一轮周期的考量，“双一流”建设高校在数据增长与指标达成上成效明显，越来越多的高校挤进世界知名榜单，越来越多的教师“露脸”世界知名期刊，我们拥有世界上最多的教授、博士、项目、著作、论文、奖项等，我们很多的数字指标已经达到甚至早已超越世界第一。然而，“第一”并非“一流”，数字指标上的世界第一终究难以成就教育生长中的世界一流。从世界范围看，中国大学及学科对世界文明及科技进步的原创贡献度不高、公信力不够、引领力不强也是一个不争的事实。排名的显赫唯有融通于一流的文化价值之中并与其水乳交融，才能成就真正的一流大学和一流学科。相反，忽视文化建设、发展及评价，必然使当下的“双一流”建设陷入外表繁荣而内涵空虚的、事与愿违的逻辑悖论与发展陷阱中，从而造就或走向“失去灵魂的卓越”。^［4］

四、统计测量抑或专业判断：评价方法的考量

对评价方法的考量是“双一流”建设成效评价合理与否的关键要素之一。评价方法不同，所需要的评价程序就会不同，与之相应的评价结论自然会有所差异。“双一流”建设成效评价的有效开展，不仅需要对评价对象、评价目的和评价内容进行深思，还需要在评价方法上不断地作出权衡考量。回顾评价理论的发展历程，科学、专业的评价方法至今大概已历经四代：^［5］第一代评价方法侧重实验测量，将评价当成“测量”或“测验”，认为一切事物均可借助“测试”来检验；第二代评价方法注重客观描述，将评价看作综合评定，认为科学的评价离不开全面、明确、具体的证据，不仅要呈现基于某一测验的量化结果，还要从多个方面综合描述量化结果与预定目标之间的一致程度；第三代评价方法强调价值判断，反对“预定主义”和“科学主义”，关注评价过程本身及其价值属性，将评价由描述上升为判断，认为评价并非依据预定目标而对量化结果的综合描述，其本质为价值判断；第四代评价方法主张协商共建，反对“管理主义”和“权威主义”，提出评价作为一种价值判断，并非评价者（管理者）基于管理权威与主客二元对立的单方面的价值体现，而是一种基于评价者与被评价者间相互理解、平等对话和协商共建的实践过程。当前，中国评价实践的主要取向可以归结为两种评价方法：统计测量和专业判断。前者融合了西方第一代评价理论与第二代评价理论的优势，青睐评价的工具理性，关注评价的量化指标，主张评价应秉持价值中立的原则，注重从技术层面上对评价对象进行统计与测量；后者吸收了西方第三代评价理论与第四代评价理论的精华，强调评价的价值理性，重视评价的质性思考，提倡评价须遵循对话协商的原则，注重从价值层面上对评价对象进行全面分析与专业研判。客观而言，每一代评价理论及每一种评价方法在其既定的时空范围内均具有一定的必然性、可行性与合理性。同样，它们也均具有一定的适用范围与边界限定，若离开这一限定，理论就会因泛化而失真，方法也会因硬化而失效。

具体到教育领域，科学、专业的评价方法无疑倾向于专业判断。大学教育是一项极为复杂的系统工程，也是一项专业化的社会实践活动，与人（成人）紧密相联，与价值密切相关。对教育的评价自然不是单一的统计学或数学问题，不能停留在简单的“统计测量”或“量化计算”上，而是一个多元的（显性或隐性）且涉及多方的（直接或间接）专业性问题，显然离不开全面的价值分析与复杂的专业判断。^［6］教育评价更多的是各学科专家的事情。在教育评价中，专家的价值与作用恰恰在于借助渊博的专业知识并通过多方调研取证而做出全面、综合的专业判断，而非一味扮演计量人员的角色。“双一流”建设成效评价作为一种教育评价，虽起于事实判断但务必要归于价值判断，虽需要数据指标但终究离不开文化价值，这是教育评价的常识表达，也是“双一流”建设成效评价的根本遵循。然而，时下正在发生的各类大学教育评价（包括“双一流”建设成效评价）显然有所偏颇，存在着偏离教育价值属性和文化内涵、青睐数据指征和指标满足的倾向。诚然，在科学主义时代，偏好统计与量化并非大学教育评价独有的问题，而是很多评价共同的病症。可是，相比其他领域，大学教育量化评价的科学性更加值得商榷，一旦失衡，其危害性更大。一方面，量化评价难以全面地反映大学教育的真实状态。量化评价往往通过预先设定目标（在实践中通常具体化为诸多指标）并借助科学的手段来评价、引领某种教育结果，从而实现结果与目标之间的匹配和平衡，这显然忽视或降低了教育过程本身的价值，势必让评价过程沦为机械控制过程。事实上，教育在生成、发展与创造人的过程中常常会产生一些不可预测的教育结果，而这些结果大都并非科学方法所能够测量与计算的。另一方面，量化评价极易使大学教育陷入功利主义的误区。在量化评价的驱动下，实践中的价值理性被简化为了数字计算，数字计算为各方营造了一个令人舒心且皆大欢喜的幻象，继而“大学中的芸芸众生无不对标对策，寻找活路”，^［6］大学教育在各方的共同努力下心安理得地坠入了功利主义所编织的“数字陷阱”。

综上，在校校争创一流的时代背景下，“双一流”建设成效评价必成为指挥棒，因而更需要对此做出理性的反思。从本源上看，“双一流”建设成效评价只有符合大学的常识理性与发展规律，满足立德树人的根本要求与根本任务，关注教育的价值属性与文化内涵，注重质性分析与专业判断，才能够摆脱大学教育评价长期存在的纠结与无常，从而规避或走出管理主义、科学主义、预设主义、工具主义和功利主义的误区。

（作者：董云川李保玉文章来源：《上海教育评估研究》2021年第5期）

参考文献：

［1］刘庆昌.一种弱功利的教育评价哲学［J］.教育发展研究，2018，38（12）:1-11.

［2］刘志军,徐彬.教育评价:应然性与实然性的博弈及超越［J］.教育研究,2019,40(5):10-17.

［3］周光礼，蔡三发，徐贤春，等.世界一流大学的建设与评价:国际经验与中国探索［J］.中国高教研究，2019（9）:22-28.

［4］［美］哈瑞·刘易斯.失去灵魂的卓越［M］.侯定凯,译.上海:华东师范大学出版社，2007.

［5］Guba E G，Lincoln Y S.Fourth Generation Evaluation［M］.Los Angeles:Sage Publications，1989.

［6］董云川.高等教育普及化语境下的评价反思［J］.江苏高教，2021（4）:1-5.

上一条：论交叉学科组织建制的悖论和建设策略

下一条：“双一流”建设成效评价的特征与趋向

【关闭】

“双一流”建设成效评价的本源追问

联系我们