天涯书库 > 认知升级 > 第4章 选择哪所学校会让孩子的成绩更优秀? >

第4章 选择哪所学校会让孩子的成绩更优秀?

先生,为了他的教育,我可没少费心;让他从小就在街上跑,自己养活自己。这是让孩子学得机灵点儿的唯一办法呀。

——大维勒先生,选自《匹克威克外传》(狄更斯,1836年)

如果说在过去的20世纪里人们确实变得更聪明了,部分原因是人们受到了更多、更好的学校教育,那么能够通过改善学校教育使智力得到更大的提升吗?如果可以,需要怎么做才能让学校变得比现在更好呢?这些是摆在美国人面前亟待解决的问题,因为美国在教育成果上的表现远远落后于大部分发达国家。在常识测试中百分位排名第95位的美国学生,只相当于某些得分很高的国家中排名第75位的学生。[1]美国最优秀的学生(5%的学习大学预修课程微积分科目的顶尖学生以及1%的学习大学预修课程物理科目的顶尖学生),得分也不过相当于其他国家顶尖的10%~20%的学生。所以,即使只拿最优秀的学生来比较,也能看出美国与其他发达国家之间的巨大差距。

留给我们改进的空间还很大,所以让我们看看怎样做才能够让孩子们变得更聪明,学习成绩更优秀吧。

投入更多的教育经费管用吗?

关于花钱也无济于事这一点,倒是有一些非常惊人的证据。从20世纪70年代开始,研究人员就一直坚持认为,拨给学校的教育经费的数额与其效果并不存在密切的联系。通常采用多元回归分析的研究都会得出这样的结论。研究人员在多元回归分析中引入了大量变量,然后确定究竟是哪个变量在起作用。这些研究基本上都是要确定如果不考虑其他因素,投入的教育经费的数额是否会对教学效果产生何种影响。研究结果大致是这样:如果钱是花在东北部的学校上,这些学校的学生主要是较富裕的白人家庭的孩子,钱的数额不会对教学效果产生什么影响。如果把钱花在南部的学校上,这些学校的学生主要是贫穷的少数族裔家庭的孩子,钱的多少也不会对教学效果有什么大的影响。

很明显,只向学校投入一定数额的教育经费本身并不会对教育产生任何影响。法官有时要求社区向家境贫寒的孩子和家境富裕的孩子就读的不同学校划拨同样的经费。当经费拨给家境贫寒的孩子就读的学校后,这些额外的经费可能并没有经过认真思考和筹划就被花掉了,而且也没有证据显示学生们的成绩有什么进步。典型的例子发生在堪萨斯城。司法要求大幅增加学校的经费。学校用这些钱兴建了奥运会规模的游泳池,最先进的科学实验室,并给每名学生配一台电脑。结果是:学习成绩没有丝毫的进步。钱本身并不能提高学生的成绩,尤其是当经费的管理人能力不足或出现贪污行为的时候(就像某些大城市里发生的那样),增加教育经费就更不可能提高学生的成绩。另外,在发达国家,每名学生教育支出的多少与学生参加国际数学和科学趋势研究测试的得分高低没有必然联系,这也证明了钱本身并不能提高学习成绩。一些得分很高的国家,其人均教育支出还不到中位数,一些人均教育支出超过了中位数的国家得分却较低。

不过,这也并不意味着钱一点儿作用也没有。在后面的章节里,你会发现能够证明通过增加穷人和少数族裔人的教育经费来改善教育质量的蛛丝马迹。

教育券与特许学校有用吗?

许多教育评论家都曾强烈要求实行教育券制度——把钱发给学生家长,这样他们就可以把孩子送到私立学校去读书。但是研究人员不应该将得到并确实使用了优惠券的学生与没有得到优惠券的学生做比较,因为这里存在着自我选择的问题,情况或许是,得到并最终使用教育券的学生家长,都是一些受教育程度较高、聪明又有进取心的父母。那些宣称教育券计划起到了很大作用的人,实际上的确是将得到并实际使用了教育券的孩子与没有得到教育券的孩子做了比较。这样的研究发现黑人与白人考试成绩的差距缩小了1/3。但实际上,这样的“收获”中至少有一部分显示的只是不同学生家长之间的差异。也就是说,有的父母很在意孩子的教育,所以最终使用了教育券,送孩子去更好的学校,而有的父母也许得到了教育券,但最终可能使用也可能不使用它。有些研究人员坚称他们可以采取一些措施控制自我选择效应,例如,比较的对象虽然仍是使用了教育券的学生和没有得到教育券的学生,但二者在很多方面都很接近。这简直就是无稽之谈。一旦为自我选择敞开了大门,怎么可能通过将比较的对象一一对应起来来规避问题呢?换句话说,一组父母接受了听起来对子女有利的帮助,而在一些方面与之相近的另一组父母可能未必会接受这样的帮助,这两组父母在其他方面也可能有很大的差异。

采用合理的方式对教育券效果进行研究后,比较得到教育券(大部分人都接受了教育券)的学生与参加教育券的抽签但未中签的学生的学习成绩,证据显示使用教育券大约可以将学习成绩提高0.1个标准差。(这种比较采取的是意向治疗的方式:对一个治疗组里面的全部学生进行分析,不管学生是否都接受了这种治疗。即使这种治疗有效,效果也因这种情况不可避免地被低估了,但是这样可以避免致命的自我选择。如果治疗组里只包括那些学生——其父母确保他们会接受治疗,将治疗组与控制组进行比较就会出现自我选择效应。)这种令人失望的结果当然不能证明私立学校不如公立学校,只是到目前为止,也没有什么令人信服的证据能够证明被研究的私立学校确实比公立学校好。

另外也没有证据能够证明,总体而言特许学校能使学生更加受益。特许学校也依靠政府的拨款,但可以不遵守政府用来管理其他公立学校的某些规定和法律。但是反过来,这样的学校必须在校章里保证取得一定的成绩。一些合理的实验随机选取了一些研究对象,然后将特许学校和其他公立学校进行比较。不幸的是,特许学校只比孩子们有可能去的公立学校略胜一筹——至少在特许学校刚刚开办的头几年里是这样。拿数学和阅读来说,特许学校中较低年级的学生在标准化考试中的成绩只前进了几名。大一点儿的学生在高年级时第一次进入特许学校后的成绩,还不如公立学校的学生。不过,也有一些证据显示,在特许学校开办了10年以后,与公立学校相比,它们或许会具备10%的优势。不过这不应该理解为特许学校不如公立学校——只是到目前为止胜过公立学校的特许学校还不多。在后面的章节里,你们就会欣喜地发现这一结论至少存在一个让人高兴的特例。

班级人数的多少有无影响?

班级人数的多少会有什么影响吗?学生人数更少的班级是不是更好呢?我们掌握的证据也是互相矛盾的。采用多元回归分析的研究人员往往会告诉我们,班级人数的多少不会影响学生的表现。而另一方面,在研究班级规模的影响方面颇有建树的研究人员,经济学家艾伦·克鲁格坚持认为,70%关于班级规模的研究都得出了肯定的结论,即班级人数的多少会影响学生的表现,而且刊登这些研究成果的杂志越重要,得到肯定结论的可能性就越大。克鲁格和我都认为,有一项研究比所有其他的研究加起来都更能说明问题。这项研究是20世纪80年代在田纳西州进行的。幼儿园和小学一至三年级的老师及学生被随机编为一般规模的班级(平均22人)或人数较少的班级(平均15人)。人数较少的班级中的学生在标准化考试中的成绩,要优于一般规模班级的学生,进步的程度根据科目和班级规模从0.19到0.28个标准差不等。换句话说,在人数较少的班级内学习,通常能使一个孩子的学习成绩的百分位排名从第50位升至将近第60位。至少在七年级前,这样的效果都非常显著。相对于中等阶层的白人孩子来说,班级人数较少对家境较差的少数族裔孩子的影响更大。

教师的水平高低有关系吗?

那教师呢?他们的水平会对学生有什么影响吗?有些教师肯定比别的教师更优秀吗?答案是肯定的。不过事实上,一个持有证书的教师未必就是一个出色的教师。即使拥有硕士学位也不能说明一个教师很会教书,这没有什么可奇怪的。

即便如此,还是有不少证据证明教师的确很重要。首先,教学经验很重要。只有一年教龄的教师和有10年教龄的教师教出来的学生,阅读成绩测验的得分平均相差0.17个标准差——也就是说教师的教学经验可以使学生成绩测验的百分位排名提高7个位次。不过请注意,通常在教师工作的第一年才会出现这些由教学经验造成的差距。所以还是要留心,尽量避免把孩子送进一个由刚走上工作岗位的教师负责的班级中去。

将某一班级中的中等学生在成绩测验中的分数,与根据前一年中等学生的分数做出的预期进行比较,高出的部分就是教师的附加值,我们可以用附加值来定义该教师的水平。如果学生的成绩超过根据前一年或前几年同年级学生的成绩做出的预期,我们可以说教师的附加值很大。按照这个定义,如果教师水平相差1个标准差,那么学生的测验成绩就会相差大约0.2个标准差。不过这只是对同一所学校内不同教师造成的差异做出的估计。既然我们知道某些学校里教师的水平平均来说要高于其他学校的教师,我们就可以肯定,这种对同一所学校内教师水平差异的估计一定是教师水平差异的最小值。将不同教师不同学校的差异纳入考虑后,经济学家埃里克·哈努谢克估计,教师水平对学习成绩的影响是0.27个标准差——这足以使一个学生在成绩测验中的百分位排名从第50位升至第60位。教学水平等于或高于所有小学教师平均教学水平1个标准差的老师,以及教师水平等于或低于所有小学教师平均教学水平1个标准差的老师,二者教出来的学生其成绩测验分数究竟有多大的差距很难计算,不过显然会相当大。

人们往往会谈到某些教师对他们有重要的影响,这使得类似有关教师教学水平的统计数据不那么苍白无力了。很多我认识的人都认为,教过他们的老师中至少有一两位对他们产生了非常重要的影响。我们没有理由怀疑他们所说的,因为有一项关于一年级教师对学生造成的影响的研究证明,他们所讲的个人经历并不是信口开河。

A女士在一所学校里任教已经有34个年头了。这所学校主要面向社会经济地位较低的人群,其中1/3的学生都是黑人。这项研究采访了60个成年人,他们在11年的时间段里都曾经在这所学校里学习过。其中1/3的人读一年级时的教师是A女士,剩下的40名被采访者读一年级时的教师不是A女士。在这40名被采访者中,31%已经记不起一年级老师的名字了,而所有A女士教过的人都还记得她的名字。不管能不能记住教师的名字,这40人中只有1/3的人给他们老师的评价是非常好或出色。而A女士的学生中有3/4对她的评价都很高。其他老师的学生只有25%对教师用心程度的评价是A,而A女士的学生中有71%给出的评价是A。当被研究人员问及A女士是如何讲课的,我的一位同事回答:“她是带着对学生的爱在讲课。”这位同事还说,A女士表达了她对所有学生的信心,认为他们都可以学习——不会有一个学生在离开她的课堂时还学不会如何阅读。她不仅会在放学后留下来帮助那些学习吃力的学生,还经常把自己的午饭分给那些忘记带午饭的学生。

A女士的学生在小学、青少年时期和成年后与其他学生相比要出色得多。A女士教过的这些学生中,有2/3在二年级时成绩就排在了全年级的前1/3,而其他教师的学生中只有28%进入了年级的前1/3。研究还测量了这些学生成年后的状况,例如受教育程度,职业成就以及家庭状况。A女士的学生中有64%都处于最佳状况,而其他教师的学生中只有29%处于这种状态。

即使没有其他更令人信服的、量化的证据证明教师(尤其是一年级教师)的重要性,这个故事也并不能算作证据,因为这只是关于某位个别教师的特殊案例。不过确实存在其他证据。教育研究人员布丽奇特·哈姆雷和罗伯特·皮亚塔接触到了由美国国家儿童健康与人类发展研究所主持的一项规模庞大的纵向研究,即儿童早期保育研究。他们跟踪记录了900个孩子从幼儿园一直到小学一年级结束的整个过程。根据孩子母亲受教育程度所反映的社会经济状况来判断,有些孩子被认为恐怕很难适应学校的学习。另外,根据幼儿园老师报告的孩子在行为、注意力及学习成绩方面出现的问题来判断,有的孩子可能会面临比其他孩子更多的问题。

观察人员在每间教室里都旁听了三个小时,对一年级的教育质量进行评估。所有班级按照两个相关但在统计学意义上又各自独立的方面划分等级。第一个方面是“教学支持”,是几项评估得分的总和,其中包括读写技能的教学质量,对孩子的评估性反馈的质量,师生谈话涉及教学的程度,以及对孩子责任感方面的鼓励。第二个方面是“情感支持”,也由几项评估得分组成,包括情绪气氛,对课堂的有效管理,例如拉近与学生之间的距离,以及不对学生过度干涉等。

所有班级按照教学支持的质量分为三个等级。所有的孩子都接受了一项广泛适用的能力测试——伍德科克·约翰逊认知能力测验。

把一个因母亲受教育程度较低而被视为可能会面临问题的孩子,安排到教学支持较小的班级,与被安排在教学支持较大的班级中的学生相比,一年级期末时这个孩子的测验成绩可能要低0.4个标准差。把一个具备同样风险的孩子安排在一个教学支持较大的班级,他的成绩实际上与那些父母受教育程度较高的孩子的平均成绩不相上下。

所有班级也按照情感支持的水平分为三个等级。(总的来说,教学支持级别较高的班级,情感支持的级别也较高,而教学支持级别较低的班级,情感支持的级别也较低,但也不完全如此。)有些孩子由于幼儿园时在社交和情绪方面表现不佳,被认为可能存在留级的风险。把这样的孩子安排在情感支持较小或一般的班级里,其学习成绩可能要比被安排在情感支持较大的班级中得到的成绩低0.4个标准差。根据幼儿园时的表现被认为存在留级风险的孩子,如果被安排到有较大情感支持的班级里,他的成绩和班级里那些没有这种风险的孩子并没有什么不同。

接下来要讲的这个发现或许比听上去更为重要。哈姆雷和皮亚塔在此前的一项研究中发现,在幼儿园时不善与人相处的孩子,可能整个上学期间的学习成绩都会受到影响。对一年级教师水平的研究结果表明,有类似问题的孩子如果在一年级时能够在适宜的班级里学习,他们的发展轨迹可能一开始是向下的,但可能很快就会出现逆转。

校长都清楚自己学校里教师的水平——至少清楚哪些教师最好,哪些教师最差,但是还没有证据显示校长会苦心寻访或奖励高水平的老师。实际上,对于公立学校的教师来说,这一点是很难实现的。工会的规定往往是在不同老师之间实行基本相同的工资待遇,并且待遇上的差异只能与资历、资质和学历有关。正如我之前提到的,没有证据证明资质和高学历就一定代表教学的高质量,而且除了在开始教学的第一年,资历也不能说明教师的水平。对这些情况有所了解的研究人员往往分成两个阵营:(1)改变工会的规定,对教学水平高的教师进行奖励;(2)承认这种做法恐怕难以实现,因此只能对教师进行培训,进而提高教学水平。

大家都同意,对于改善教育,我们能做的最重要的事情之一就是提高教学质量。也许应该先从学校开始。新老师们普遍抱怨他们上的教育理论课程太多了,而经验或实习则少得可怜。另一种提高教学质量的方法可能是给优秀教师发放奖金。以色列的研究人员对两个不同的奖金计划进行了研究。一个奖金计划是根据学生的成绩向位于前1/3的学校的所有老师发放奖金。奖金数额相当于基本工资的1%~3%。另一个奖金计划是为获奖的学校提供更多资源,主要是提供教师培训或减少教学时间。这两个计划都颇有成效,使学生的成绩有所进步,退学率有所降低。但是相较而言,增加工资的奖金计划更合算。研究显示,向学校发放奖金或许能避免工会的种种麻烦。可以想见的是,如果这样的奖金被视为一种额外收入,并且发放的对象不是个人而是学校,教师和工会或许就会接受这种竞争,因为这种竞争的奖励模式是“稳赚不赔”的。不过,和评估教师的水平一样,究竟如何评估学校的质量,恐怕也是个无休无止的难题。

教学成果卓著的学校就是好学校?

直到最近,依旧没有什么令人信服的证据能证明哪些教学方法的效果更好。早就有大量关于“有效学校”的报道——这种学校出来的学生,其成绩都大大超出人们的预期。不过这样的证据并不能使人完全信服。都说好学校一定有一位好校长,这样的校长会向大家传递一种信念:相信大部分孩子都有学习的能力;会仔细地挑选教师并监督他们的行为;会想方设法将不合格的老师清理出教师队伍;重视课程设置和教学策略;关注学生的表现,以便确认学校的教学策略是否有效;鼓励家长加入到孩子的教育中来。有效学校里的教师也较容易亲近,而且通常一开口就三句话不离本行。这些教师一般更容易接受评估,并且更喜欢接受这种评估。他们会随时关注学生的表现,以确定学校的教学策略有效与否。

大部分关于有效学校的报道,都是介绍那些面向经济条件较差的人群的学校。通常认为,那些更强调基础知识的学校对于这样的人群更有效。不过另一方面,有的人也认为,有效学校的课程安排如果能像高水平的私立学校那样丰富,它们就会取得很好的效果。

总而言之,教学效果更理想的学校,一般来说都有好的校长、更有效的教学策略、更全心全意地培养孩子的教师。不过这些报道并不能让我相信是这些特点使得学校成绩斐然,反而仅仅反映出一个事实,那就是这些学校的学生更好管理。如果学生们更易管理,校长就会看起来很称职。如果学生们总是不断地惹麻烦,那么第一要务就是要抓纪律,课程安排或教师评估只能先靠边站了。所以虽然关于好学校的故事不断上演,却没有多少无可争辩的事实能让我对如何改善表现不佳的学校抱有信心。

每项教育创新的举措都有效吗?

尽管对各种创新教育计划的投入已经高达数亿美元,对这些计划的评估也多如牛毛,但教育研究的现状令人汗颜。这些研究不仅大都不能使人信服,而且不少自封的教育计划评估者实际上并没有采取正确的实验法进行研究。实验法是指从某个人群中随机选出一些孩子,对他们采用一种教学方法,再对随机选出的另外一些孩子采用另一种教学方法,然后将两种情况加以对比。实际上,很少有教育研究遵从了这样的科学标准。

这种情况令人觉得不可思议,就好比制药公司在未经任何评估研究证实药效的情况下,就将生产的药品兜售出去,而有时这种评估研究也只是随便地让一些患有某种疾病的病人服用这种药物,然后记录下有多少比例的病人病情有所好转(但这样并不能确定有多少比例的病人病情好转根本不是由于服药)。确定一定数量的患有某种疾病的患者,然后对其中一部分使用某种药物的人进行治疗,而对另一部分人不进行治疗或使用另外一种药物治疗,然后比较两组患者的情况,这样的药物测试才算得上是合格的实验研究。但是有关教育举措的研究几乎从未达到过这一标准。谁要是说,评估教育研究不需要随机选取研究对象也可以取得一样或更好的效果,你就应该问问他们,为什么教育研究和药物测试要采用不同的标准。

不使用实验法的人给出了不少理由。有人称这是出于道义方面的考虑,接受治疗的应该是最需要接受治疗的人,而不应是随机选取的。但既然要从道义方面考虑,调查人员就必须能够证明这种治疗是有效的——可以找到一群最需要接受治疗的人,一半编为治疗组,另一半编为控制组。在这些理由中,听起来最有道理的是,实验法不能找出某种治疗中究竟哪些是产生疗效的成分。连某种治疗是否有效都不能确定,怎么可能知道这种治疗疗效如何呢?

最近,关于学校的研究至少都采用了某种形式的控制方法以进行对比。在一些研究中,调查人员说服学校同意采取某种干预措施(例如一种新型的数学电脑教学法),然后将这些学校的成绩与那些没有采取这种干预措施的学校的成绩进行比较。根据预先制定的一系列标准来衡量,例如学生所属的社会阶层和种族,这些学校的水平都很接近。这种研究虽然聊胜于无,却也仅仅只是好一点点而已,因为存在自我选择的问题:在某些研究人员并不清楚的方面,受邀采取某种干预措施的学校或许不同于那些未受邀请的学校。有自我选择的自由时,这个问题就显得尤为突出,也就是说,只有一部分受邀的学校最终采取了这种干预措施,这些学校或许在某些相关方面优于那些虽然受到了邀请但最终没有采取行动的学校。

只比较采取某项干预措施前后的表现,也算不上是充分的研究。而有些研究在衡量某项干预措施效果大小时,比较的是采取了干预措施的学校和水平接近但未采取干预措施的学校两者的表现。我们会发现,前一种方法显示的效果一般比后一种方法要好得多。这一规律只存在一个特例,就是当采取干预措施后学校取得了非常大的进步——这种进步与没有采取干预措施的学校的表现有着天壤之别。只有在这样的情况下,人们才能够相信这样的教育举措确实是行之有效的。

“全面的学校干预措施”效果显著吗?

得到评估的教育计划中有,一部分叫作全面学校干预措施,也就是大家熟知的全面学校改革。教育心理学家杰弗里·博尔曼及其同事回顾了其中一些最有前途的计划。只要看看他们的回顾就可以对这些计划有所了解。我只介绍那些经独立第三方测试过三次以上的计划,这些测试都是比较了采取干预措施的学校与作为控制组的学校二者间的差别,与此同时,学校或学生都不是随机选取的。

一项全面学校干预计划——全体成功——在比较研究中被第三方调研人员评估了多达25次。这项计划是由一项私立基金管理的,参与的学校多达数百所。这项计划为学校准备了特殊的课程资料,包括教师行为规范手册。同时还在阅读、写作和语言艺术等科目上为教师提供了大量的培训,以及为期26天的现场职业发展训练。这项计划侧重评估学生的成绩以及学校的管理,并为每所学校配备了一名辅导人员,对在阅读上吃力的学生进行一对一的辅导,同时还强调父母的参与。最初这个项目只是面向从幼儿园到小学六年级的学生,不过现在把初中生也纳入进来了。一些学校还参与了“根与翼”计划,这个计划是对全体成功计划的扩展,包括数学、科学以及社会研究等项目。

全体成功计划似乎提高了学生们的成绩,但越独立、设计越合理的评估,其显示的效果越差——所有调研发现的平均效果值是0.08个标准差。不过,一项设计合理、完全随机选取调查对象的研究显示,所有从幼儿园到小学二年级一直参与该项目的学生的阅读成绩平均提高了0.27个标准差。不仅如此,有4项评估将“根与翼”项目也纳入进来,这些评估显示出的进步令人大为吃惊——0.77个标准差。如果想让如此大的效果值看起来可信的话,这几项研究必须都要做到独立、证据确凿,并且要完全随机选取研究对象。尽管做了如此多的研究工作,对全体成功这个计划是否有效还没有定论。只有围绕着该项目的研究能够做到证据确凿并随机选择研究对象,我们才能得出最终的结论。

学校发展计划也是一项众所周知的全面学校干预措施,是耶鲁大学的精神病学家詹姆斯·科默于30多年前创建的。该计划并未设置特别的课程或采用与众不同的教学方法,而是尽力在教职员工、家长和社区之间构建起良好的关系,并对学生采取一些健康的干预措施。该计划还成立了几个小组,负责实施针对不同学校的特殊需求制定的改革措施。不过第三方比较研究显示的效果值仅为0.11个标准差。

效果稍好一点的是针对小学的直接教学干预措施,这些小学主要面向家庭经济境况不佳的学生。这项计划的阅读和数学项目是由麦格劳·希尔出版公司负责的,同时还提供了一些教师培训。但是整个项目要与供应商签合约,由它们来提供扩展的专业课程开发和教师培训。这些课程的教学计划都写得很详细,并要求学生完成大量的写作任务。学校根据学习成绩将学生编成小组进行教学,并时常对学生的学习进度进行评估。第三方比较研究显示的效果值是0.15个标准差。

一些全面学校干预措施的成本非常高。所以我们在衡量效果大小的同时,还要考虑到性价比。为这些项目以及那些没有得到广泛评估的项目说句公道话,有些被评估的干预措施在某些学校里并没有得到很好的实施。如果不认真对待,一项干预措施就不会显示出什么效果。因为在估计效果大小时,不论执行得好的、执行得不好的,还是执行得完全走样的,都要放在一起得出平均效果值。

改善教学方法用处更大

也有一些研究是关于具体教学方法的。评估研究人员詹姆斯·库利克回顾了大量的所谓的综合学习系统。这些电脑软件系统根据学生的水平制定课程资料,记录学生的学习效果,并给出关于学习成绩的大量反馈。库利克得出了一些非常明确的结论。他发现,在关于数学项目的16项合理选定控制组的研究中,电脑化教学的平均效果值是0.4个标准差。这样大的效果对教育是非常重要的,并且除了购买电脑外这个项目的成本并不高。教写作的文字处理项目同样对提高阅读能力具有很大的影响。高年级的效果值是0.25个标准差,幼儿园和小学一年级的效果值则更高。(在提高阅读能力而不强调写作的电脑化阅读项目上,平均效果值只有0.06个标准差。)最后,电脑辅导对自然和社会科学的教学具有非常显著的成效。这些课程的平均效果值是0.59个标准差,这可以算得上是非常大的效果值了。电脑辅导还可以激发学生对所学科目的兴趣:效果值达到1.1个标准差。

到目前为止,让人印象最深刻的方法就是一种被称为“合作学习”的课堂教学方法。学生们被分成不同的小组,互相帮助学习一些材料。这种方法对任何科目都适用,只有所有学生都参与进来才算达到学习的目的,从二年级到十二年级都可以采用这一教学方法。教育研究家罗伯特·斯莱文写了整整一本书来介绍这些方法。斯莱文对研究有一定的要求,必须有一个控制组的学生学习同样的资料,并且研究必须有适当控制,如果不能保证随机选择个人、班级和学校,就要采用对应的办法——也就是找到在很多衡量标准上都和接受这个项目的学生水平极为接近的学生。巧合的是,使用更为优越的随机选择方法和使用对应的方法得到的结果大致相同。在其中一个互助学习的项目中,即学生小组成绩分工法,每4个学生被分成一组(通常这些学生的成绩水平或种族各不相同,或者两者都不同),一起学习各种资料,然后对每个学生进行评估。斯莱文在书中提到,研究显示这种方法对标准化考试的效果超过了0.3个标准差。其中尤其令人印象深刻的是一种叫作“结构二人组”的方法:一名学生当辅导员,另一名学生接受辅导,然后双方互换角色。互助学习有很多种不同的方式,据报道,所有方式的效果都非常好。已经有足够的相关研究显示,在从二年级到十二年级的教学中学校都应该采纳这种互助学习的方法。

总结

那么我们能够有哪些选择呢?学校能够采用新方法进而更有效地让人们变得更聪明吗?可能有很多种“不能”的回答,或至少是类似“暂时还不能”或“不太可能”的回答。钱本身并不能实现多大的改变。与普通公立学校相比,教育券和特许学校也不能使学习成绩有显著的提高。教师的资格证书和文凭与学生成绩也没有什么必然的联系。不过教师的经验确实有用,至少在一定程度上如此:任教未满一年的新教师水平肯定有待提高,并且可能需要几年时间的磨炼才能学会如何教书。

教师的授课水平很关键,一些教师就是比别人教书教得好。但是现行的制度没有对最优秀的教师进行奖励,也没有淘汰最差的教师。虽然研究尚未成熟,但是至少还是有一些证据显示,对那些在提高教育成果方面取得最好成绩的学校,为学校的所有老师提供奖金就能够改善教学成果,而且很有可能有些提供奖金的计划不会涉及任何政治方面的问题。

关于“有效学校”的介绍虽然告诉了我们什么样的校长和教师能使学校的水平有所提高,但并没有说清楚其中的因果关系:乐于奉献的校长和专心教学的教师在多大程度上能够决定学校的优劣?更易教的学生在多大程度上能够让校长乐于奉献或教师专心教学?一些全面学校干预措施虽然有一些作用,但到目前为止还没有证据显示这些措施能够产生非常大的效果。

有一些非常有利的证据显示,电脑化教学很有效,尤其是在数学和科学方面的训练上。另外,使学生们朝着共同的教学目标一起努力的合作学习方式也前景广阔。

美国教育部旗下的“有效教育策略资料中心”受到了极大的欢迎。这项服务对评估研究显示为有效的干预措施进行审核。不幸的是,这些评估研究的设计通常都没有达到随机选取研究对象的实验标准,但至少比逸事报道要令人信服得多。所有申请参加有效教育策略资料中心审核的研究,至少应该是“设计合理的准实验研究”,而这一标准远远高于大多数评估研究的标准。我们可以期待,最终教育工作者们只会采纳经有效教育策略资料中心证明确实有效的干预措施,否则恐怕很难向愤怒的公众交代。

让孩子们学习解决问题的本领能提高智商吗?

如果我们倾力教授孩子们解决问题的本领,这能比让他们学习适当难度的材料更有效地提高智商吗?对于能够通过后天学习来提高智商持极度悲观看法的《钟形曲线》一书,其合著者之一理查德·赫恩斯坦在委内瑞拉进行了一项规模极为宏大的研究,为上述问题提供了非常引人注目的答案。赫恩斯坦及其同事设计了一套高难度的教材,只向七年级的学生教授一些关于解决问题的基本概念,不涉及任何具体的科目。实际上,他们想要通过给孩子们的智力工具包提供方便的工具来使孩子们变得更聪明。

孩子们学习的概念和方法都接近高中或大学水平,而不是初中水平。研究人员设计的课程每节45分钟,总共60节。这些课程的主题包括:学习分类和假设检验的基础知识,学习可以按照某些方式排序的量度的特点,探索分级归类的结构和用途;分析类比,探究简单命题的结构;理解逻辑的原则;构思和分析复杂的论点,发展能为一个问题列举出所有可能解决方案的系统化方法;学习如何权衡结果的合意性和可能性,评估数据的可信度和相关性。这些工具通常都是学习某一科目或学科的副产品,而不是老师要详述的内容。我们能不能直接教授这些工具——甚至是教给孩子们——然后说明这些工具同样适用于解决一些他们以前学习时没有遇到的问题呢?

一个字,能。正如研究人员所设计的那样,学习这些新技能极大地提高了孩子们解决问题的能力。得出的部分效果值如下:语言理解,0.62个标准差;学习如何表示“问题空间”,0.46个标准差;决策能力,0.77个标准差;创造性思维,0.5个标准差。简而言之,一般的解决问题的技巧不但是可以学习的,还可以在很短的时间内学会。

那么智力测试测量的“真正的”智力呢?学习解决问题的能力能够提高智商吗?我认为智力测试不是测量智力的唯一方法,而只是其中一种特别的方法。如果我们能够提高人们推理和决策的能力,我不在乎他们能不能在智力测试中获得更高的分数。但是实际上,在一套测试普通能力的有代表性的测试中,委内瑞拉研究中的实验组的分数比控制组高出0.35个标准差。在一项叫作奥蒂斯—伦农学校能力测试的典型智力测试中,与控制组的学生相比,实验组的学生的智商平均提高了0.43个标准差。卡特尔文化公平智力测验与瑞文推理测验比较类似,测试试题非常具体,并且有大量测试空间能力的试题。即使是这项测试中,实验组的学生的得分也平均提高了0.11个标准差。总之,不论是用赫恩斯坦及其同事教授的那种解决问题的一般能力来测量,还是用传统的智力测试来测量智力,这一训练都收到了很大的效果。

你们可能很好奇这些调查人员后来去做什么了。他们是不是接着为八年级的学生开发了更为复杂的工具?不幸的是,委内瑞拉的政府改组了,提高中学生的智商也就不再是什么头等大事了。尽管如此,我必须说,鉴于这个项目取得的巨大成功,我很诧异也很沮丧地发现,居然没有人沿着这个项目的足迹继续走下去。

怎样做才算是有效的家教?

最后,让我们回忆一下,很多教学都采用的是一对一的家教辅导的形式。辅导者的水平有高有低,这不足为奇。实际上,马克·莱珀及其同事发现,大学生担任的家教以及其他一些对小学生进行辅导的家教,水平参差不齐,有的家教辅导几乎一点儿效果也没有,而有的则对接受辅导的学生非常有帮助。他们从这些高效家教身上找出了一些令人感兴趣的特点。

首先,一个低效的家教是什么样的呢?要成为一个低效的家教,最有效的方法就是把自己当成一个“纠错器”。明确地告诉你的学生她犯了一个错误,然后直接告诉她应该如何改正这个错误,最好使用抽象的方法来说明其中的规律。莱珀的研究中没有一个高效的家教采用这种纯认知化的纠错恣态。

怎样做才能变成一个有效的家教呢?莱珀给出了5C(Control,Challenge,Confidence,Curiosity,Contextualize)原则。

在学生身上培养一种控制感(Control),让学生感觉到自己能够掌握所学的内容。

向学生发出挑战(Challenge)——不过挑战的难度不要超出学生的能力范围。

通过大力表扬学生的成功(表达对学生的信心,使学生确信自己刚刚解决的问题难度很大)和淡化学生的失败(为学生所犯的错误找出种种理由,强调学生做对的部分)向学生灌输信心(Confidence)。

使用苏格拉底的问答法(诱导性的提问),并将问题与学生已经见过但表面上看起来却并不一样的其他问题联系起来,通过这样的方法培养学生的好奇心(Curiosity)。

将问题放在真实世界的环境里或电影电视节目中出现的环境里,使学生学会在一定情境里思考问题(Contextualize)。

专家级的家教各自都有不同的策略。他们不会改正像忘记写“+”这样的小错误,而是当学生要犯错时,引导学生远离错误,避免错误的发生。或者有时候他们任由学生犯错,认为这对学生来说是宝贵的学习经验。他们不会因为要顾及学生的面子而降低学习内容的难度,相反,他们会换一种方式表述这些内容。大多数专家级的家教都向学生提问,问一些诱导性的问题。他们让学生来解释他们的思路。比起表现欠佳的家教,专家级的家教给出的表扬较少。据莱珀推测,低效的家教给予了学生过多的表扬,这会让学生有被评估的感觉。最后,专家级的家教永远都精心培养、体贴自己的学生。

所有有追求的家教——还有学校里那些有追求的教师都应该学习这些。

总结一下:我们知道了学校更能提高教学的质量。我们也了解了究竟哪些做法有效而哪些无效。如果学校没有参照经研究证明有效的方法来指导教学,恐怕难辞其咎。

但事实上,教学对于某些学生来说更有效果。接下来的两章里我们可以看到两类不同的学生,然后考虑一下究竟该如何改善这两章之后的章节中描述的情形。

[1] 美国教育部1998年的数据。