西方教育评价的历史与发展

本文在详细考察西方教育评价理论演变过程的基础上,以动态的视角分析比较了几种具有代表性的教育评价观点和模型,深刻揭示了教育评价理论的周期性规律和总体发展趋势。

关键词:教育评价教育评价模式教育评价是一门古老而年轻的学科,其起源可以追溯到中国隋代的科举制度。但作为一门独立的分支学科,逐渐向科学方向发展,却主要是在19年末和20世纪的美国。在这有限的历史中,教育评价的理论体系从简单到完善,评价模式从单一到多样,发生了一系列的变化。笔者认为这些变化至少应该包括:一是教育评价理念的演变;第二,教育评价基本范畴重心的变化;第三,教育评价理论基础的变化。开展上述研究是非常有价值的。因为这种变化本身就表明了这门学科的发展趋势,也说明了教育评价作为教育科学的一个分支,与其他基础学科有着千丝万缕的联系。因此,研究西方教育评价理论的演变,有助于我们从哲学的高度把握学科发展的脉搏,从历史、现实和未来的角度对其进行综合考察,探索教育评价的本质和发展规律,以期解决实际问题。

限于篇幅,本文仅从纵向的角度着眼于西方教育评价观的演变和发展趋势,并比较两者的差异以得到一些重要的启示。至于后两种变化,笔者会在另一篇文章中详细讨论。

第一,教育评价理念的变异

1,泰勒的评价观19世纪下半叶和20世纪前30年,教育家们在量化、对象化、标准化学业成绩方面取得了巨大成就。但当时的课程和考试都是围绕和以课本为中心编写的,考试内容只要求学生记忆课本的知识内容,所以非常片面。在这种情况下,美国俄亥俄州立大学教育科学研究所教授泰勒(Tayler,R.W)主持了课程与评价的研究,提出了一套以教育目标为核心的编写原则,试图将社会的要求和学生的需求反映到课程和测试中。为了将这一思想与早期的测量运动区分开来,泰勒和他的同事们正式提出了教育评价的概念。泰勒将评价理解为“确定教育目标在多大程度上被真正理解的过程”,即“评价过程实质上是衡量课程和教学计划实现教育目标的程度的过程。”以目标为中心,通过具体的行为变化来判断教育目标的实现程度,是泰勒教育评价的主要目的。

2.Crombach的评价观泰勒模型在历史上长期占据主导地位,受到很多人的批评和反对。因为只把目标作为评价的出发点和最终归宿,似乎违背了教育评价的初衷。为了让人们注意到评估的全部作用,克朗巴赫将评估宽泛地定义为“收集和使用信息,以便对教育项目做出决策。”他认为,评价不仅仅是考察一门课程是否有效,而是确定需要改进的方面。根据Crombach的观点,评价的重点应该是教育过程,应该对教育决策进行必要的改进,而不是仅仅关心教育过程结束后目标实现的程度。克伦巴赫的观点在教育评价领域产生了广泛的影响。

3.Stufflebeam的评价观Stufflebeam也对泰勒的评价模型提出了异议,他的观点与Crombach的观点非常一致。他认为,“教育工作者需要更广泛的评价定义,而不仅仅是确定目标是否实现”,评价应该“有助于更好地实施和改进我们的计划”。④作为泰勒评价的替代,Stufflebeam将评价定义为“为决策提供有用信息的过程”。⑤他强调:“评价最重要的目的不是证明,而是提高。”这一观点很快得到了教育界的广泛支持。在1985中,他进一步提出:“评价是一个描绘、获取和提供叙述性和判断性信息的过程。这些信息涉及研究对象的目标、设计、实施和影响的价值、优缺点,从而指导如何决策,满足教学效果验证的需要,增加对研究对象的了解。”与这些观点相对应,Stufflebeam提出了CIPP模型,该模型以评价为工具,对教育活动的背景、信息输入、活动过程和结果进行综合评价,从而使程序更有效地服务于程序使用者。

4.毕比的评价观1975,毕比。C.E .将评价定义为:“系统收集信息和解释证据的过程,在此基础上针对行动进行价值判断。”他认为,评价是收集系统的而不是零散的数据,并对这些数据进行仔细的整理和解释,引入批判性思维。在这里,毕比第一次提出了教育评价的本质,即价值判断。他强调,评价要判断教育活动的价值,包括教育目标本身,使评价活动有助于科学决策,对实际工作有指导意义。毕比“价值判断”的提出深化了教育评价的内涵,使评价的另一个主要特征“价值判断”越来越受到人们的关注。

5.斯塔克的评价观:在肯定评价是一种价值判断的基础上,斯塔克(R.E .)提出了反应评价模型。他提出:“如果教育评价比节目内容更直接地指向节目的活动,如果它能满足观众对信息的需求,或者反映节目得失的评价报告能更好地反映人们不同的价值观,那么这种评价就可以称为‘反应性评价’”。在他看来,要使评价结果真正有效,评价者必须关心这个活动所有参与者的需求,通过信息反馈使活动结果满足各类人群的需求。斯塔克强调“多元现实”。他认为,以前的预定评价对正在进行的项目不敏感,很难从与老师和其他学生的接触中察觉学生的收获,或反映对项目的不同看法。他同意Screvane的观点,即评估经验的内在价值比评估难以捉摸的好处更好。