■潘鸣威
自从2014年我国国务院颁布 《关于深化考试招生制度改革的实施意见》 以来,升学类的英语考试,如高考英语和研究生入学英语考试的题库建设就提上日程。不少学者在各种场合纷纷提出,中国作为“考试大国”,没有成熟的题库对人才的科学选拔不利。“题库”一词也成为外语教育界中各种新媒体追逐的网红。此外,冠以“题库”的练习册和复习资料满天飞,似乎让考生在新一轮的考试改革中找到了新的曙光。社会上甚至有一种误解,认为掌握了所谓的题库不断刷题,就具备了“制胜克考”的法宝。这说明,成熟的题库建设,并非一朝一夕。
并非题量大的就能成为“题库”
虽然教育界和非教育界的人都热议题库,但是究竟什么是真正的题库,很多人都有误解。
国际上的英语水平考试,如托福、雅思等都是以题库作为命题依据的,我国的大学四、六级英语考试亦是如此。作为世界最大的私立非盈利性教育考试和评估机构,美国教育考试服务中心 (ETS) 对“题库”的定义是“具备教育测量学参数、可依据不同需求和难度特征等进行组卷的单题集合”。
可见其中至少包含了三层重要内容:一是题库组成的个体是每个单题(在语言测试领域亦称为项目),而非针对某一测量目标的系列试题,亦非是已成套的试卷。
二是每个单题背后有大量的数据。题目本身有其测量的目标和所依托的文本内容。除此以外还有大量的统计数据,这些数据通过试测的方式取得,涵盖了题目的难易度、区分度、猜测度、信息值和能力值等等。
三是题目之间可以通过一定的方式组卷,但组卷本身并非人为,而是系统根据单题背后的大量信息在优选论的基础上进行组合。
因此,反观教辅市场上的“题库”材料,大多只是针对某一知识内容的习题,既无试测数据支撑,亦无组卷机制构建。这种所谓的“题库”胜在“量大”,充其量是“题集”,根本无“库”可言。
高考改革中,题库的建设必不可少
近几个月来,各省市相继颁布了新高考改革方案,高考英语几乎都是“一年两考”。题库可以为此带来什么呢?
在此姑且不评论这种做法的优劣,从现实情况出发来分析,我们可以发现,题库的使用可以提高考试的公平性。
首先,高考英语在成绩报告中采用原始分,不作等值处理,那就给“一年两考”的难度均等提出了挑战。
如果采取等值处理,虽然有一定程度的科学性和公平性,但考生和家长却很难接受。这是因为原始分很有可能因为某次考试难度的降低而被降分 (比如125分在等值后可能成为120分)。此外,等值后的分数由于与原始分不同,也将大大增加施考机构的查分工作,并带来巨大的舆论压力。因此,在“两考”成绩不作等值处理的情况下,如仍沿用封闭式的经验性命题,则“两考”的难度均等很难掌控。
正是由于源头的控制极为重要,真正意义上的“题库”就给源头把控提供了可靠的阀门。
前文提到,题库中的题目是有预先试测的,而试测群体接近考生群体的实际水平和作答情况。即使无法做到完全对等,也可通过项目反应理论等统计手段视为同质。这样,“两考”所反映出的难度、能力值等参数就可以在组卷的过程中加以定义,确保“两考”成为极为近似的“平行卷”,在现有的考试制度下达到最佳的妥协。
不得不谈的题库风险
任何成熟运行的题库都会受到试题曝光的困扰。试题曝光不仅发生在题库的建设阶段,也可能发生在施考的过程之中。在建库阶段,如果征题来源不合理,比如征题人员学缘结构单一、人员配备不足、选材资料过于陈旧,这些因素都会对题库的建设带来负面的影响。而且题库建设初期库容有限,可供组卷的试题更是捉襟见肘,如果新的毛题打磨之后即入题库,则很可能会与同期上市的试题选材重合。
国内外成熟的题库中,一道题目从征题到磨题,再到入库一般要经历三至四年左右的时间,这不仅可以有效地避免毛题被试测群体曝光的可能,也可避免与同时期的教辅试题撞车。加上现在社会培训机构对考试的关注度持续升温并不断跟踪某些考试的命题思路,极有可能发生考题与前面所提到的“题集”发生“巧合”的情况。
其次是施考过程中的试题曝光。比如雅思考试每次施考的题目并不对外公开,但却在我国的考试市场中盛行着“机经”,即考生在考试结束后马上回忆考试内容和试卷编号,之后在网络中传播。通过几年考试的轮转,雅思考生似乎在“还原”题库的全貌。因此,我国高风险的考试在运用题库命题后,如何规避施考过程中的试题曝光问题也是值得深思的。
成熟的题库建设不是一蹴而就的,而是通过十几年、甚至是几十年的打磨臻于完善的,其中征题和磨题的质量仍是题库建设的重中之重。在利益不冲突的情况下,题库的建设理应是高校英语教育者义不容辞的使命,参加征题的人员不仅应具备命题的知识和能力,也应遵循语言测试者的职业道德。
(作者为广东外语外贸大学副教授)