关于教师评价(teacher evaluation),可以有两种理解,一种是教师所做评价,即教师对教学、学生学习等所做评价;一种是教师所受评价,即学校、学生以及社会各方面等对教师所做评价。本文主要针对国外高校学生评教研究对我国教师评价研究的启示进行了一些研究,文章是一篇甘肃省教育论文发表范文。
摘 要:学生评教是高校教师评价的常见手段;教师评价是对教师在科研、教学与其它学术或专业工作中的表现与业绩做出评价。国外学者已经对高校学生评教中的核心问题开展大量实证研究,发现教师性别差异、教师科研状况、教师个性特征、教师对学生的宽严度、学生的认识水平等变量对学生评教结果产生影响,使评教结果偏离真实。有不少研究者对学生评教的可信度与存在价值持怀疑态度。国内高校管理者在对教师评价中过分看重、甚至只看重学生评教结果,在教师职称评聘与岗位业绩考核等多方面过多或者仅仅以学生评教结果为依据,这会造成严重不良后果。学生评教,是一项复杂的系统工程;学生评教研究,是一个涉及面广与涉及问题多的领域,是一个具有重要意义的领域。
关键词:教师评价,学生评教,实证研究
一、学生评教的合理性
教师评价即对教师在科研、教学与其它学术或专业工作中的表现与业绩所做评价。由于教学具有复杂性,不同的学科有不同的评价方法与标准,不同的评价主体往往做出不同的评价,这使如何比较科学地评价教师的教育教学工作成为教师评价中的一个难点。从评价主体看,教师教学评价主要有学生评价、同行评价与专家评价等三种;其中,学生评价及其结果被使用得比较广泛,但是,它们引起的争议也最为巨大,如很多教师认为学生在学识水平上根本不具备评价教师的能力,在实际操作中也存在被同行评价为相当一般的教师被学生评价为很好的现象。
然而到目前为止,国内对教师评价的研究主要有三种形式:第一是介绍国外经验,如“当前美国中小学教师评价的特点及其启示”[1]、“国外教师评价新动向”[2]、“英国教师评价制度的新进展”[3]等等;第二是对教师评价进行描述性研究,如有研究“国内高校教师评价体系的变迁历程与阶段特征”[4],或从理论上对教师评价进行思辨式探讨,如“教师评价方法的选用标准”[5]、“论建构主义视野下的教师评价”[6]等;第三是介绍教师评价的方法,如“增值评价法”[7]、“教学档案袋”[8]、“微格教学评价法”[9]、“末尾淘汰制”[10]、“绩效考评法”[11]等。
学生评教是高校评价教师的常见方法之一,国外学者已经开展相当数量的实证研究,然而,在国内,相关实证研究尚比较少见。因此,本文拟以外语教师评价为例,就国外学者对学生评教的核心问题与关键变量问题展开的研究进行梳理,以期为国内开展教师评价以及高校管理者更好地使用学生评教结果提供借鉴。之所以以外语教师为例,是因为外语教师的学生接触面远远大于专业教师,外语教师评价中的学生评教问题具有代表性与普遍性。
二、国外学生评教研究的核心问题及其基本发现
对于学生评教这一教师评价形式,国外实证研究展示出两种截然不同的态度,即:完全赞同与完全反对。一些变量,诸如教师性别差异、教师科研状况、教师个性特征、教师对学生的宽严度、学生的认识水平等等,是否对学生评教结果产生影响,产生多大影响,都有人做过实证研究。
(一)教师性别差异是否影响学生评教?
外语教师的性别差异是否会导致学生评教的结果差异?对于这个问题,国外的研究结论各异。如费尔德曼(Ken Feldman)的研究认为在学生评教几乎不跟性别内容相关[12],而卡新(William Cashin)则发现男生与女生评教可能会因为教师性别差别有差异[13]。在早期研究中,研究者们一般都认为男教师得到的评价比女教师高[14];但是,其他研究者却认为1980年以前的数据库中几乎没有什么证据表明女教师得分一直比男教师低,而学生们确实显得更喜欢相同性别的教师,他们发现性别角色原型对女教师的影响比对男教师的影响大的多[15]。这个发现也得到后期的一个研究的支持[16],该研究的结论认为女教师必须付出更多的努力才能得到与男教师相同的评价。巴索(Susan Basow)和斯皮尔伯格(Nancy Spilberg)也得出类似的结论,认为男学生对女教授的评价低[17];而巴索[18]和桑特拉(JACentra)[19]17-32等人的研究揭示另外一个倾向,即女学生会认为女教师的教学更好。巴索的另一个研究发现女学生选女教师为最佳教师的人数会比男学生多,男生则更愿意选男教师为最佳教师,但在选最差教师时则没有性别差异;最佳女教师被学生认为比最佳男教师更乐于助学,反映出细微的性别原型印象差异[20]。这些研究让人们思考一个问题,如何避免学生评价时出现性别偏见[21]。
郎本(Laura Langbein)收集近3000份问卷,发现:女教师会因为支持型行为与关爱型行为受到鼓励,也会因客观型行为与权威型行为而受到惩罚[22]。另一个研究表明:如果教师的行为没有达到学生的性别角色期望值,学生会对女教师表现出更多的“敌意”[23]。福特(David Foote)、哈门(Susan Harmon)和玛佑(Donna Mayo)在一个研究中发现学生的性别角色态度不影响评教行为[24]9-18。克雷森(Dennis Clayson)和格林(Karen Glynn)发现显著的性别交互结果,即男生与女生在评教过程中会使用不同的个性特征组合:男生认为一个“好”男教师应该是“有经验、易接近、值得喜欢、直截了当和工作勤奋的”,一个“好”女教师应该是“自信、漂亮、不唠叨的”;女生则认为一个“好”男教师应该是“有抱负但又敏感、关心学生的”,一个“好”女教师只有两个社交互动变量,即“关心的,值得喜欢的”。[25] 最近,有研究者发现本科生对女外语教师的评价比对男外语教师的评价高,但研究生对男教师的评价更高[26]。 以上研究表明:男外语教师可能更受偏爱;女教师如果希望得到比男教师更高的评价,可能需要付出更多的努力;如果男女教师得到相同的总体评价,背后的因素很可能不同;学生似乎更喜欢同性别教师;学生群体中可能存在着认识差别或社会偏见,因此,不同的研究得出不同的结论。
(二)教师科研状况是否影响学生评教?
很多教师认为,做科研使他们能够站在学术前沿,而站在学术前沿使他们能够提高教学水平。这种信念有一定逻辑合理性。站在学术前沿的教师可以给学生传递更多信息,也应能够在该学科共同体内更好地指导学生,其教学水平必须高出不做科研的教师。但是,也有一些人认为,当一个好教师与做一个好研究者是有矛盾的,主要是因为兴趣与时间的分配上难以协调。
王 帅:国外高校学生评教研究对我国教师评价研究的启示
那么,教师科研状况,包括科研能力与科研成绩等,在学生评教中是否得到反映?尽管还没有明确的证据表明不做研究的教师就一定会得到不利的评价,但是不少研究发现有科研创造性的教师与只会教学的教师有着明显不同的个性特征[27]。费尔德曼认为:教师做研究会有利于教学的可能性是非常小的,并且从实用的角度来说这两者是基本不相关的[28]。该观点得到玛茜(Herbert Marsh)和哈提(John Hattie)的支持,他们通过元分析看教学与科研的关系,发现用于科研的时间与用于教学的时间成反比关系[29]。以后,哈提和玛茜又调查12000多次学生评教,没有交待教学评价结果与科研之间的关系,提出几种可能的解释,但是,没有否定评价的有效性[30]。
外语教师科研能力,在教师们的认识与关注中,是一个重点。但是,已有研究表明:外语教师科研成绩高下及能力强弱,对学生评教结果似乎没有什么影响。这一现象,可能成因是什么,已有研究没有揭示。
(三)教师个性特征是否影响学生评教?
一般来说,个性问题是被看作是一个人内在的、持久的一个变量,但是对学生评教过程影响较大。总体上,桑特拉[19]17-32和布拉斯堪普(Larry ABraskamp)[31]114-120等人研究没有发现个性特征与学生评价等级之间的相关性。也有研究报告说,学生对教师的评价在课程早期的就已经形成,而随后的教学和学习体验几乎不会改变他们对任课教师的看法[32]。哈佛的研究者奥姆巴蒂(Nalini Ambady)与罗森赛尔(Robert Rosenthal)做过一个研究,调查学生对随机选择的30秒长度的真实课堂教学无声录像的反应,结果发现其评价与学期末学生评教结果高度相关;独立评价专家给出的个性特征与评价也高度相关,按照顺序依次为“乐观,自信,主导,活跃,热情,可爱”,而给出的“专业”评价与学生评价无显著相关性[33]。一些教师简单地把有效教学与个性特征联系起来。兰托斯(Geoffrey Lantos)鼓励教师使用幽默、有趣的游戏,记住学生的名字,待人真诚等方法来激励学生[34]。在回顾一些文献及自己的研究后,福特等研究者认为:很多教师在学生评教中得分高,不是因为他们使用以上的方法,而是他们与学生相处得好[24]9-18。
尽管与学生评教中其他因素相比,有关教师个性的研究相对还比较少,但是,现有研究表明:教师的个性特征,尤其是给学生的早期印象和与学生的相处情况,对学生评教有直接、持续的影响;外语教师如果和学生相处良好,尤其能得到学生好评。
(四)教师给学生评分的等级会影响学生评教的结果吗?
很多教师认为他们给学生打分数的等级与学生评教的结果之间是存在一定关系的。有研究者在荷兰一所大学进行问卷调查,发现:65%的教师认为对学生的评分越严,学生对教师的评价越低;当问及学生评教过程是否会鼓励教师对教学要求“放水”时,72%教师做出肯定的回答;近49%的教师说他们的上课内容比过去有所减少,约1/3的教师说他们降低了学生通过的标准,仅有7%的教师说提高了标准[35]。这些教师的认知基本上没有新意,与其他研究者30年前在美国中西部的一所大学的调查结果非常接近:作为对学生评教的应对措施,39%的教师报告说其他教师私下暗示过他们降低了评价标准,只有13%的教师提高了标准[36]。在十几年前,22%的学术型心理学教师承认他们为了保证受学生的欢迎而简化课程内容或课程考试[37]。另一个调查发现39%的高校管理者知道哪些教师为了学生评教分数高而降低评分标准和工作标准,仅21%的管理者说他们没有意识到有教师因为学生评教问题而产生的失常行为[38]。对学生的调查支持了管理者和教师的看法,在一个研究中,70%的学生暗示说他们会依照老师给他们打的分数来评价教师[39]。吉尔摩尔(Gerald Gillmore)和格林沃德(Anthony Greenwald)报告一项研究发现:6个真实课堂中教师宽松地评价学生,结果,学生对教师的评价较高[40]。尽管很多教师承认在教师打分与学生评价之间存在联系,但很多教师仍相信严格的学术标准不会显著改变学生评价等级[31]114-120。玛茜等研究者经过分析后认为:原因是很多学生把教师对他们的打分等级与内容的掌握程度联系起来,学生得分高说明教师教得好[41]。
梳理现有研究,可以发现:教师评分的宽严程度与学生评教的等级高低有相关性,但导致这种相关性的原因错综复杂。
(五)学生的认识水平是否会影响评教结果?
因为学生认识水平因素影响,学生评教结果是否具有充分可信度,研究者们有这样一个疑问:学生在填写评教表格时说的是真话吗?一般都认为,学生在评教时似乎不会诚实地反映真实信息[42]101-112。然而,还没有研究表明学生是恶意地或有意识地提供虚假信息。众所周知,评价中的光环效应表明学生会忽略单个问题的内容,只在总体上对他们关心的一些方面进行评价[43]。斯坦费尔(Larry Stanfel)发现学生诚信问题,发现他们可能会对问卷做出虚假回答[44]。斯布罗洛(RSproule)的研究表明即使教师及时批改作业并在紧接着的下一次课上发给学生,仍然有50%的学生认为作业没有“及时”地返还给他们[45]。一项最近研究表明,学生知道在评教中有平均30%的评教分数是不实的,而且,大部分学生不觉得故意误评教师是一种“欺骗”[42]101-112。 从以往研究看,学生的认识水平,如不能全面看待教师、易受外在因素影响、不能认清故意误评的欺骗性质等等,学生评教结果并不具备充分可信度。
三、国外高校学生评教研究基本发现的主要启示
如上节所述,国外高校学生评教研究显示,教师性别差异、教师科研状况、教师个性特征、教师对学生的宽严度、学生的认识水平等,对学生评教结果产生影响。这些发现对于学生评教研究与实践富有启示意义,对于教师评价,尤其是外语教师评价富有启示意义。
(一)教师性别因素可能影响得分
教师性别差异可能影响学生评教结果,使评教结果偏离真实。首先,如果学生更喜欢同性别教师,在男女教师教学水平与效果相当的情况下,参评学生中男女学生比例会影响评教结果,男生多则男教师获得更好评价,女生多则女教师获得更好评价。其次,在男女教师教学水平与效果出现差别的情况下,参评学生兴趣会影响评结果,好学者多则男教师所得评价通常会高于女教师。这似乎是一种规律。和女教师相比,男教师通常有更多时间准备教学,有更多时间做研究,并且有更多时间进修提高,因此,教学水平与效果确实高于女教师。用联合国教育科学与文化组织工作报告的说法,是男教师比女教师更具“活动性(mobility)”:“对于女性活动性的限制,影响她们学习职前与更新课程的能力”。[46] 因此,女教师要付出更多努力才能获得相同评价或更高评价。其三,如果学生兴趣都不在学业,教师可能通过颜值和与学生关系等非学术因素得到好评,英俊的男教师、漂亮的女教师可能会获得较高评价。
(二)教师科研能力与业绩不一定能得到反映
在高校,多数教师与管理者会认为:大学教师科研能力与业绩,会在相当程度上影响教师教学水平与效果。但是,国外研究基本上表明,教师科研能力与业绩在学生评教中得不到反映。这一现象,至少给评教研究者与实践者四个启示。第一,教师科研能力与业绩可能都很出色,而且也能体现在教学之中。但是,学生不能从教学中感知教师科研的水平状况。第二,学生只关注教师的教学水平与效果,可能不认同它们会受科研影响。第三,一些课程,因为学术性含量不足,不必要教师有科研能力与业绩支撑,学生也不希望教师带入太多科研内涵。第四,教师科研能力与业绩一般或不佳,科研不能促进教学水平提升与效果改善,教学中也不可能带入科研内涵。第四个启示特别符合全球外语教师的实际状态。外语教师的科研能力与业绩等问题,是全球性问题。世纪之交,联合国教育科学与文化组织一份工作报告就已经指出:在高校存在一些不做研究工作的教师,这已经成为一种普遍的趋势;他们经常有很重的教学任务;他们通常被安排教授课程体系中的次要科目,如语言课程,特别是学科内涵厚重的专业课程体系中的次要课程。[47]。
(三)教师个性因素可能左右评价
关于教师评价,国际上已经有一种共识:其功能与目的是“促进教师个人发展”,因此,“只能基于学术标准,评估教师个人在研究、教学与其他学术或专业职责中的表现”。[48]也就是说,教师个性特征,虽然可能影响学生学习情绪以及效果,却不能作为教师教学评价的依据。然而,学生评教,依据的可能恰恰是不能作为依据的教师个性特征。
(四)教师评学的宽严可能决定学生评教的宽严
评价教师的教育教学工作,即使有刚性评价标准及刚性标准细则约束,评价立场及评价结果也可能会受到评价者自己的兴趣和需求的影响。让学生来评价教师的教育教学,这种影响几乎更是不可避免,一是因为他们的思维和行为还不太可能超越自己的兴趣和需求,二是因为学生们的思维和行为等更容易受氛围左右。教师评学严格,学生评教也会严格,教师评学宽松,学生评教也会宽松。教师评学的宽严,决定学生评教的宽严,这既可能是学生们有意识地给教师等值的回报,也可能是学生们无意识地顺从大流。
(五)学生因认识水平限制不一定具备应有评价能力
学生,作为教育的对象,在认识能力、理解能力与判断能力等能力方面,都有待改善。这是一种实然,是一种应然,更是一种必然。根据国际通行的认识,教育是“经过设计的导致学习的有组织的和持续的交流”,而学习是“行为、信息、知识、理解、态度、价值观与技能的改善”。[49] 可以说,在校学生正处在认识、理解与判断等多种能力的改善中,这些能力是评教必需,如果其中一项或多项能力改善没有到位,他们就不具备评价教师教育教学的能力。让不具备评教能力的学生评教,不是将教育教学往上推,而是往下拉。
综之,上面五点启示,可以归结到一点:学生评教,容易偏离学术标准,滑向与教师学术或专业职责不相关或不相符的诸种因素,使评教结果偏离真实;而一旦评教结果偏离真实,学生评教必然会偏离预设目标。因此,研究者与管理者都要慎重对待与使用学生评教结果,不能让学生评教左右教师评价与教育教学管理。实际上,学生评教,是一种利益相关者参与教育教学管理。利益相关者参与高等教育管理,在高等教育大众化时代,是一种利益诉求。但是,利益相关者参与高等教育教学管理,使高等教育教学的“高级的与共同的标准”下拉为“多元的标准”,使各种决策不再由精英圈走学术化途径进行而是由全部利益相关者走“更加‘民主的’政治程序”进行,如果过度与不当,就会导致高等教育系统崩溃。[50]这是一种预警[51],应该引起重视。
四、对国内学生评教研究与实践的若干思考
国外学生评教研究已经进行20多年,不同的研究,结论不一致、甚至互相矛盾。学生评教能否提高教师的教学水平,并没有完全或一致证明,因此,其存在价值一直处于争议当中。以往的学生评教对大学教育教学产生了什么影响?学生们是否因此受到更好的教育?教师的教育教学水平是否因此提高?国家的教育水平是否因此提高?到目前为止,诸多必须通过研究证实的问题,都没有获得证实。证实学生评教的意义、革除没有存在价值的学生评教和寻找对教育教学有促进意义的学生评教,都需要继续开展研究,尤其是实证研究。 有管理者或管理者兼研究者直接借鉴国外研究结果,但是,这些研究结果在中国环境下未必适用,即未必能说明中国环境下学生评教的理论与实践问题。当然,国内也有研究者研究学生评教问题,具体到外语教师评价,也有人做过一些实证的研究,如王晓群、郑新民运用话语分析法对大学生对中外英语教师的授课方式的评价进行研究,分析我国大学英语教学改革存在的问题,探讨寻求解决问题的途径[52]。不过,总体说来,在学生评教研究上,相对于国外,国内研究(人员、经费与精力等)投入远远不够,有待大大加强。
国内学生评教研究,既要对国外研究已经涉及并且得出初步结果共同性问题做实证研究,也要对国内环境下产生的非共同性问题做实证研究,具体问题如:怎样建立科学的评价方式?科学研究与教学如何有效衔接[53]?如何整合奖惩性评价和发展性评价以更好地促进教师成长[54]?外语教师的工作量是否会影响学生的评价?学生评价是否确实是评价教师的教学水平而不是评价其他因素?学生评教与教师同行评价、专家评价是否存在差异?需要研究的问题很多。
国内高校管理者,出于对行政效率的考虑,在对教师评价中过分看重、甚至只看重学生评教结果,在教师职称评聘与岗位业绩考核等多方面过多或者仅仅以学生评教结果为依据,这会造成严重不良后果。如,教师不敢严格要求学生、甚至过度讨好学生,以获得学生好评,这必然最终导致教学质量下降,危害到高等教育质量。高校管理者要正确对待学生评教的结果,国外已经有研究指出:“学生评教似乎在范式上存在严重缺陷,如果一定要将之用作评价教师教学质量,那么至少管理者和同行一定要严格监控”[55]。国内也有相似认识:学生评教一定不能作为评价教师的唯一标准,还应综合同行评价和专家评价的结果。[56]。
高等教育系统属性决定,学生评教在教师评价中不能占据中心,不能占太大权重,只能处于辅位,作为补充性参考。即使只处于辅位和只作为补充性参考,学生评教实践操作,在内容、指标和程序设计等多个面度上,必须要注意几点:
第一,关注学科课程特色。学科课程不同,目标不同,与科研关联度也不同,一些学科课程不要求教学紧跟研究前沿,一些学科课程严格要求教学紧跟研究前沿。联合国教育科学与文化组织有关文件明确区别“研究(research)”和“学问(scholarship)”:前者是科学、技术、工程、医药、文化、社会、人文与教育等领域里的“原创性(original)”研究,是“认真的、批判性的、规范化的探究”,后者是自我更新、学术编辑、知识传递、学科教学技能改善和学术进修。[48]语言基础课,无论是外语还是母语,目标都不是传递学科科研前沿成果,而是进行积累性输入,以提高学生输出能力,严格按照课程目标进行教学,任课教师,无论科研能力强弱与科研业绩高下,都不能、也不应该在教学过程展现学科科研状况,因此,其科研能力与业绩在学生评教结果中也必然得不到反映。
第二,排除非学术性因素的影响。教师性别、颜值与个性等非学术因素,可能对师生关系有一定优化作用,可能因为优化师生关系而在一定程度上促进学习,但是,它们不一定能改变教育教学水平,不一定能切实提高学生学习绩效。要排除这些因素影响,可以采取两种措施:一是如果必须包括这些因素,将它们划入没有权重的背景内容;二是减少得分可能受这些因素影响的内容及其权重。
第三,回避学生能力不足以评估的面度及环节。因为道德能力、情感能力和认识能力尚在发展之中,学生不一定能够评价教师的教育教学工作。如果必须让学生参与教师评价,可以有两种做法:一是只让学生评价他们能够做出准确评价的面度;二是只让有足够能力评价教师的教育教学工作的学生参与评价。
总之,学生评教,是一项复杂的系统工程;学生评教研究,是一个涉及面广与涉及问题多的领域,是一种具有重要意义的领域。
参考文献
[1]王景英,梁红梅.当前美国中小学教师评价的特点及其启示[J].外国教育研究,2002(9):54-59.
[2]张辉华.国外教师评价新动向[J].外国中小学教育,2002(6):36-38.
[3]王小飞.英国教师评价制度的新进展――兼PRP体系计划述评[J].比较教育研究,2002(3):43-47.
[4]田静,等.国内高校教师评价体系的变迁历程与阶段特征[J].清华大学教育研究,2006(2):58-61.
[5]代蕊华,王斌林.教师评价方法的选用标准[J].教师教育研究,2006(2):58-60.
[6]张晓洁,母小勇.论建构主义视野下的教师评价[J].教师教育研究,2006(5):30-34.
[7]王斌华.教师评价:增值评价法[J].教育理论与实践,2005(23):22-25.
[8]王斌华.教师评价模式:教学档案袋[J].教育理论与实践,2004(13):24-28.
[9]王斌华.教师评价模式:微格教学评价法[J].全球教育展望,2004(9):43-47.
教育论文发表期刊推荐《学位与研究生教育》创刊于1984年9月,1988年由内部出版发行改为公开出版国内外发行(双月刊),2001年改双月刊为月刊。杂志由国务院学位委员会主办,中国学位与研究生教育学会协办。杂志社设在北京理工大学。杂志的首任主编为柯有安教授(1984-1989);第二任主编为朱鹤孙教授(1990-1994);第三任主编为王越教授(1994-2000);现任主编为匡镜明教授。