标准化考试正在肆意膨胀、变异,几近要吞噬整个学校,就像那些老式恐怖电影中的怪兽一样。(当然,在《深夜秀》里,从来没有人会坚称那些怪兽实际上是在帮助我们,让受害者更加「有责任感」。)但让我们暂时搁置比喻乃至观点,来回顾这个话题下一些不争的事实。
事实
1. 我们的孩子接受考试的频率,史无前例,举世无双。
虽然先前几代美国学生都要经历考试,但考试从未如此频繁,也从未在学校教育中扮演如此重要的角色。从国际视角来看,当前的情况也实属罕见:很少有国家让高中以下的孩子接受标准化考试,或者对任何年龄的学生使用选择题考试。
2. 在比较学校或地区的考试成绩时,绝大多数的分数差异都可以由非教学因素解释。
对 1992 年全国教育进展评估的数学成绩的研究发现,四个变量(居家父母人数,父母教育背景,社区类型,贫困率)的组合可以解释足足 89% 的州际分数差异。据我所知,所有对州级考试的类似分析都得出了相似的结果,其数字只有微小差异,因考虑的社会经济学变量而变化。
3. 标准参照考试本就不是用来衡量学习或教学质量的。
斯坦福、大都会和加利福尼亚成绩测验(SAT,MAT 和 CAT),和爱荷华州基本技能考试以及全面基本技能考试(ITBS 和 CTBS),从设计上只会让大约一半的考生能答对大部分题目。这些考试的主要目标是排名,而不是评估;是区分学生和学校的成绩,而不是衡量他们的水平。
4. 标准化考试成绩衡量的是肤浅思考的水平。
一项发表于《教育心理学杂志》的研究,将小学生的学习划分为「积极学习」和「肤浅学习」。「积极学习」的小学生,会在阅读时问自己问题,并联系过去学习的知识;而「肤浅学习」的小学生会抄写答案,不断猜测,并跳过困难的部分。结果发现,采取肤浅学习方法的学生,更可能在 CTBS 和 MAT 中取得高分。对于中学生(衡量其 CTBS 成绩)和高中生(衡量另一个 SAT 成绩,大学入学考试)的研究也得出了类似的发现。当然,有很多学生能够深入思考并在考试取得高分——也有很多学生既不深入思考,分数也很低。但作为一种规律,标准化考试结果似乎与肤浅的学习方法有正相关性。
5. 几乎所有的专家都反对对 8 或 9 岁以下儿童进行标准化考试。
我这里使用「几乎」是不想把话说得太满,但实际上,我还没有找到一位在早期儿童教育领域的知名学者,支持对年幼儿童进行此类考试。
6. 几乎所有相关的专家和组织,都谴责根据单一考试结果作出重要决策的做法,比如毕业或升职。
国家研究委员会的立场如此,大多数其他专业组织(如美国教育研究协会和美国心理学协会),通常支持考试的美国教师联合会,甚至创制和销售这些考试的公司的立场也都如此。然而,目前超过半数的州正进行着这样的高风险考试,或计划在不久后引入。
7. 花在让学生准备标准化考试的时间、精力和金钱,必然是从他处挪用而来的。
全国各地的学校正在削减甚至取消艺术课程、年轻学生的课间休息、高中生的选修课、班级会议(以及其他旨在促进社会和道德学习的活动)、时事讨论(因为这些内容不会出现在考试中)、低年级的文学教学(如果考试仅集中在理解技能上),以及整个学科比如科学(如果考试只包含语文和数学)。如果有人怀疑学校牺牲了多少多重要的内容以追逐高分,他近来肯定没走进学校看过。
8. 越来越多的教育者在离开教育行业,因为在「问责」和「高标准严要求」的名义下,学校经受了不少变化。
我没有确切的数据,但我有足够的轶事证据支持,将其定为事实——有管理人员、教师和教育者、全国各地的观察者作证,也有几份州际调查支持,这些调查考量了教师对考试的失望程度。师范生开始对成为老师考量再三,这份职业中成绩为先,而他们被迫要让学生拿到高分。同样,正如《纽约时报》在 2000 年 9 月 3 日的头版报道中所述,「越来越多的学校失去了方向。他们的优秀教师在步入老年,而在提升分数的压力以及其他种种需求之下,本已非常困难的教师一职越发难以受人欣赏。」很现任,很多离开教育行业或者认真考虑这点的人,并不是平庸之辈怕被问责。他们其实可以算作非常优秀的教育者,只是在现在的大环境下难以开展高质量教学,并因此而倍感受挫。
面对这些难以解释的事实,标准化考试的捍卫者常常如此辩解:即使郊区学校的教育质量的确因为考试而下降了,但市区学校从一开始就非常糟糕。至少在那里,高风险的考试最终使标准提高了。
让我们假设这个论点的出发点是好的,而非是为了其他理由而辩护标准化与考试的决策。此外,我们当即可以认定,多年以来低收入少数族裔学生得到的教育服务非常糟糕。问题在于标准化考试这个解药其实比问题还糟糕——不仅是因为前面提到的八点事实,这些事实对城区学生的考试仍然是适用的。正如明尼苏达州的民主党参议员 Paul Wellstone 在去年春天的一次演讲中所说:「让学生对考试成绩负责,这句口号特别适合写成大字报,政治家还会说他们不会容忍失败,特别有益他们的形象。但这句口号是个空洞的承诺。高风险考试远远称不上改善了教育,反而是公正、准确、质量和平等的重大退步。」原因如下。
原因
这些考试可能存在偏见。
几十年来一直有批评者控诉许多标准化考试并不公平,因为来自优越背景的孩子,更可能具备这些考试所需的知识和技能。这种歧视效应在规范参照考试中尤其明显,因为这种测试需要保证分数有区分度,因此有些试题会涉及在校外习得的知识。正如 W. James Popham 所述,这为家境富裕、受教育程度高的学生提供了巨大的优势。依赖这种有偏见的考试来「缩小贫富差距」,可真是讽刺。
谁最能花钱获得更好的考试辅导呢?
随着风险增加,人们会穷极所能寻找一切帮助,一些从这种急切心情获利的公司也逐渐涌现,他们销售考试辅导材料并提供服务,最近的一些公司更是瞄准了州级考试来设计产品。自然,富裕的家庭、学校和地区能负担这类产品,而且买得起最好的一档,因此,这种考试的不公也愈发凸显。此外,即便更穷的学校凑出钱买了这些材料,他们也无法采购一些他们真正需要的书籍和教育材料了。
最贫困的人群接受的教学质量最差。
相比衡量真正的理解,标准化考试偏向衡量学生突击掌握的事实和技能,包括考试技巧本身。而少数族裔占比更高的学校,喜欢开展更多测试,并在教学中强调考试(已有数据证实),因此这些学校的教学质量也就更差。这些学校使用了一种高风险的策略,让学校更执迷于测试,并因此他们也愈发依赖直接教学和大量模拟测试。「面向技能的教学,大部分少数族裔的孩子都要经历这样的教学,这种教学方式往往让学生统一达到低水平的能力,并扼杀他们的学术潜力。」罗格斯大学的非裔美国教授 Dorothy Strickland 如此说道。
再次强调,无可否认,许多为少数族裔贫困儿童服务的学校从一开始就是二流的。然而,现在,一些在芝加哥、休斯敦、巴尔的摩等地的学校可以说已经变成了三流。受考试压力所迫,这些学校开始系统性采取低水平的刷题练习式教学,为此学区往往会购买一揽子课程。因此,当有人强调要对少数族裔儿童有「更高的期待」时,我们可能会回答,「对做什么有更高的期待?在糟糕的考试中正确完成更多题目,还是设立吸引人的项目来促进思考深度?」对于「更严格的标准」「问责」和类似口号推动的运动,只要依赖标准化考试作为成就的主要衡量,那么这些口号在意义上就降低了期望。穷孩子被命令做越多练习题(以提高他们的测试分数),他们就越落后于富裕孩子,因为有人会教富孩子怎么理解知识。如果刷题确实提高了分数,正确的回应不是庆祝,而是愤怒:考试结果得到改善,可能是牺牲了真正学习。
真正缺乏的并不是标准。
任何认真关心解决美国教育不平等问题的人,自然会想要调查可用资源的差异。有一个很好的论点是,最公平的分配策略——这在一些国家只是常识——是不仅为各学校和各地区提供相同拨款,而且为面临最多挑战的学生群体提供更多拨款。有些州的确这样做了,但绝不是所有州,而且,即使这些州的确倾斜了拨款,他们往往只会提供短期补助(根本无法补足多年的拨款缺口),并且指定这些钱要用于考试准备而不是高质量的教学。更糟的是,高风险考试系统,可能给那些已经成功的人提供更多的钱(例如,以奖金形式给予优异分数者),给那些最需要的人提供更少的钱。
很多公职人员以及类似想法的记者和观察者,很擅长对资源问题轻描淡写,并作出这样一个假定,即只要我们坚定要求「提升标准」,穷孩子和少数族裔孩子缺少教育资源的问题,便能迎刃而解。他们的言外之意就是,老师和学生本可以做得更好,但只是因为某些原因而没这么做,只需要诱骗威胁他们,他们便能提升(实际上,这是所有激励系统的潜在假设)。政策制定者的焦点已经转移到结果上的标准,而不是机会上的标准。
更糟糕的是,对于社区环境阻碍孩子成才的重要性,一些高风险考试的支持者不仅全盘忽略,而且嗤之以鼻。有人会向他们解释,孩子成绩不理想的原因有种族主义、贫穷、对罪犯的恐惧、教师的低薪、设施不充分、语言障碍等等,而他们都将其驳斥为「借口」。这不仅天真幼稚,而且冷血无情。像其他淡化结构性约束的观点一样,这种观点都会助益于有幸不必经历这些苦难的人。
那些所谓受帮助的人将被逐出系统。
一旦在教育工作者身上应用奖惩机制,那些给成绩较低的学生群体授课的人,最有可能被打上失败的烙印,并可能会辞职。少数族裔和低收入学生受到教师提高分数的不断压力的影响不成比例。但是当高风险被应用到学生时,我们很清楚哪些人最有可能因为没有通过毕业考试而无法获得学位,或者哪些人会预期到这种结果并决定辍学。如果各州坚持这种做法,让学生的命运取决于一次考试,那么未来几年可能的结果将是无比灾难性的。除非我们采取行动阻止这一切,否则我们将面临教育性种族清洗,毫不夸张。
让我们善意地假设,这个完全可预见的后果中的族群一面是无心之举。然而很难否认,即使考试不是基于常规参考,高风险考试的目的还是给学生排序。不熟悉相关心理研究(和现实)的人可能会坚称,提高标准会「激励」更多的学生成功。但请完成以下思维实验:假设一个州的几乎所有学生都达到了标准并通过了考试。大部分政治家、商人和专家对此会作何反应?他们会承认我们的公立学校很棒,还是会把这个结果作为标准过低,考试过于简单的首要证据?正如 Deborah Meier 等人所观察到的,从定义上来说,每个人都能达到的标准就不再是「高标准」了。
考试只是这个游戏的手段。在这个游戏里,很多孩子根本不可能是赢家,其中有很多是有色族裔。用这些孩子来辩护这样自上而下、高压手段、公司风格、考试驱动的学校改革,可以说是胆大包天。若要认真促进教育平等,我们要减少跟踪,让拨款更平等,让教学更精细化(而非采取过度编排的直接指导模式)。显然标准化测试处处是毛病,而它对那些最需要帮助的孩子伤害最深。
声明
Copyright 2000 by Alfie Kohn. Reprinted from Standardized Testing and Its Victims and translated by Thoughts Memo with the author's permission.
Thoughts Memo 汉化组译制
感谢主要译者 GPT-4、Jarrett Ye,校对 Shom、changxvv、Lucas-Tsui
原文:Standardized Testing and Its Victims (**) - Alfie Kohn
发表于 2000 年 9 月 27 日
作者:Alfie Kohn
创作声明:内容包含教育建议,国外经验仅供参考。