考试始于什么时候?是一个很难考据的问题,中国科举可谓历史久远而且颇为系统的考试制度,是古代世界一项了不起的发明,但是考试显然形式更多,从更早的历史描述中依然可见,比如尧对于接班人舜的种种考察,是一种古代的行为能力考试,是对一个人的能力测试,并且是对其未来岗位能力的测试,舜的表现称职,后来就接班了,当然即使是一个满分的成绩,舜也不会成为游泳健将跑步高手,这不是工作需要,也不是考试的侧重。
圣经里面也有很多考试,上帝对于亚伯拉罕的考试可谓极端,让亚伯拉罕把自己唯一的儿子献祭,这是人心的考试,非极端难以鉴别,这故事有无数的解读,但是以粗浅的来说,证明人心不要随便考试,所以时下经常冒出来的各种夫妻忠诚度孝心之类的极端考题,其实瞎掰得很。哈佛公开课《公正》开场就是一道折磨人的题,铁路扳道,死一个还是死五个的选择,这是一个著名的题目,思想题,设计很巧,在全世界都考过,答案的分布差不多,与国家种族民族文化传统等等,都没有相关性,推论人心道德其实全世界都差不多。
这些都是离大众比较远的考试,最近同桌介绍了两场考试,一场Alex正在进行中的未来问题解决,说是考试,更倾向于竞赛,是美国历史上比较悠久的中小学竞赛,分年级组的,最近恰好读《翻转人生的教育》一书知道这个赛事,读完那叫一个内心澎湃;另一场考试则是未来可能进行的,PARCC(The Partnership forAssessment of Readiness for College and Careers),同桌经历的是介绍会,是目前的iSAT的替代方案,从名字可知希望未来同时为高校录取和职场提供人的评价。(同桌补充说iSAT与SAT没有关系,目前PARCC是要占据学业水平考试。)
考试与筛选有关,属于评价工具,评定当下,预测未来,这是考试所希望实现的功能,但是考试的对象是人,对于人的考试评定的适合方法首先要依靠对于人的了解程度,其次才是考试的设计。前者的难度之大,恐怕没人否认,所有的考试方法,大都基于人们对于人的了解程度,而所谓科学时代则增加了统计的技术,如今更是冠名以“大数据”。无论统计还是大数据,基本都属于归纳思维,局限性无法克服,即使用到百分之九十九点九九九……依然是一个以偏概全,难免遇到例外。例外在工业生产来说,是可以处理的,根据物料的价格,考量一下就可以实现,但是对于人来说,未必适合用金钱计量,虽然有劳动力价格这样一回事,所以在人的考试这件事情上,一向都有破例这回事,因为不好太绝对。
考试是用来检查学生的学习情况,当然还有其他各种考评方式,量化非量化都有一定的存在必要性合理性,但是考试的存在,必然会歧化,变异,特别是考试比一般的指标更加量化清晰,特别适合评价手段,不仅是评价学生,也是评价老师。本来评价只是为了后续的学习教育,但是现实中,并非完全如此,对于学生设计未来升学机会,就业机会,对于老师,则涉及业务评定,同样关系到职业前景,还有生活质量,所以,考试并非无关紧要,而是非常紧要。而更为微妙的是教与学的核心部分师生都不是花钱的那部分,投入资本的是家长政府以及其他社会资源,他们并非专业人士,他们需要一个中立且可以理解的尺度,于是考试成为一个很好操作的标准尺度,就像产品质量标准,大众无需知道产品怎么回事,既没有必要,也没有义务,他们只需要用标准去比划一下,当然怎样的考试,就相当于怎样的产品标准。
美国的SAT经常被当作美国的高考,当然实际上不是,美国没有中国式的高考,但是SAT又确实是美国高校录取时会参考的指标,不过与中国的区别在于并不绝对按照分数排序决定录取,分数是重要的参考项目,分数高录取概率肯定高,但是两个申请人分数相差不大,并不必然高分优先;而另外一点,是国内不一定理解的,考试种类并不唯一,SAT可以,ACT也可以,还可以是其他的,负责出题的是商业公司,这些商业公司形成竞争关系,这种竞争并不以难度来比较,而是大家追求的理想,更适合通过考试发现人的差异性,所以每道试题内在的解读很重要,每道题的解答要尽可能精准体现出每个人在某个更为细小领域的表现差异。PARCC的这番登场,也是在一个大时代寻求突破的努力,目前并未覆盖全国,只是十个州,毕竟代表着一种尝试,他们在中小学推广考试,也自然回到大学去推广这类考试的理念意义等等。在有的高校声称要放弃SAT成绩的年月,PARCC并非不可能。
对于人的智力研究流派众多,也就有了智力的不同理解,加上智力本身的干扰因素也很多,人的心理、行为等等,都是我们所知有限的范畴,这些学术流派的差异,足以导致不同的考试方法。相较于国内众多具体学科的考试,美国人无疑精省许多,停留在人们最基本的要求,阅读、思维、逻辑等有限的范围,所以美国可以没有统一教材,也可以有多种考试类型。考试的理想是把人实现分类,而不是实现分级,两者虽然都是分出差别,其意义则是完全不同的。前者倾向于社会资源优化,特别是人力资源,各自选择从事适合的行当,整体而言,世界扁平,大家基本在一个平等的氛围上,人的角色是分工所致;后者则是因为上下层级的社会结构,不得不设计出上下流动的制度,但是不可避免引发人群的过度竞争,比如对常春藤,十大之类名校的追逐,引发人们的学习焦虑。
所有的考试一旦成型,就必然有一定的规律性可循,于是成为应试手段可破之处,类似于金庸所言,有招就有破招,所以无招胜有招。但是如果考试升级到这种无招状态,大约也是恐怖的,因为教育体系会变得疲于应付而很难运作。而这种按照固定“招式”运转的教育,久而久之一定会有无可避免的弊端。中国高考固然饱受诟病,美国这些年没少批评SAT,所以SAT不得不求变,相当于工业领域的产品标准修改升级。不过SAT并非教育的绝对标准,只是在美国覆盖面最广而已,学校无论中学还是大学都可以选用其他标准,国人熟悉的ACT就是一个,而此次PARCC就更新。这些考试机构本质上是教育服务供应商,他们的考试基本上是想成为关于人的评价的事实标准,这里面有商业的营销手段,但是他们没有最终决定权,而是在全社会的大博弈中,通过学校、教师、家长,甚至学生的参与,让教育变得有效,而不是折磨,特别是更加有效发现人的真实面貌。
从事过很多年质量工作,也修订过一些产品质量标准,知道有些标准对应的检验方法是现实的妥协,为了可操作的量化,而不得不偏离产品本身特性的描述,比物件更为复杂的人,考试这种质量标准,毫无疑问准确性其实更差,我们需要考试,是教育的必要手段,也是我们成长的工具,但是考试并非目的,更不是全部。人的品质智力都会有很多面,无论怎样高明的考试,最终只能发现一个面,最多几个面,反正没有一种考试可以给出对一个人的分析报告。 从我个人来看,未来的教育,重点不是学历文凭,或许更重要的是单科,各个单科的成绩,每个人选择定制自己的单科,最终构成自己的知识体系思想体系,这是源自乐高源自苹果产品的思考,基本一致的模块,最终组合成千差万别的结果,这也是人之差异性的一个方面。