手机版 English
您现在的位置: 中山市华侨中学>教育科研>教研通讯> 正文内容

教研通讯

新课程背景下高中学生学业评价相关问题的探讨

 作为教育部“新课程背景下高中学生学业评价研究”课题组成员之一,笔者有幸亲历了该课题从理论构建到实践探索的全过程。课题研究遵循的原则是:在人员构成上,大学与中学相结合;在研究层面上,理论与实践相结合;在研究方法上,独立探索与互动研究相结合。与此同时,注重调动与整合各方的资源与力量,所以研究队伍不断壮大、研究领域不断拓展、研究内容不断深化。应该说从开题至今,在理论与实践两个层面上都取得了预期的成效。限于学识与篇幅,本文仅以作者的视角反映课题研究的部分成果。

 

    一、建立新的高中学生学业评价体系

 

    在高中新课程的背景下需要建立新的学生学业评价体系,主要原因有两点。其一,高中新课程的形式与内容都发生了变化。在课程形式上,新课程以“领域—学科—模块”的结构形式取代了传统课程的“学科”结构形式。传统的以期中期末考试为主要形式的评价方式已经不再适用于新课程中以模块为基本单元的学业评价。在课程内容上,高中新课程设置的各种不同类型的模块,需要有不同的考查与评价方式,既需要有传统的纸笔测验的评价方式,也需要有一些表现式、活动式、任务式等新的评价方式。其二,新课程提出了一些新的评价理念。如:主体多元、方式多样、注重过程的评价理念;如:知识与技能、过程与方法、情感态度价值观的三维评价目标等。这些都是传统的学业评价体系中所没有的。所以新课程背景下的学业评价必须突破传统模式,代之以适合新课程评价理念和新课程结构特点的新的学生学业评价体系。

    我们认为在新课程的背景下,高中学生学业评价可以采用“2—3—2”的评价模式。即:两个评价层次、三种课程模块和两种评价方式。简要说明如下:

    整个高中学生学业评价包括两个层次的评价,即模块学业的评价与毕业水平的评价。其中基于课程模块的学业成绩评价,是由学校自行组织的、对于学生模块学习结果的评价,其结果作为学分认定的主要依据。学生毕业水平的评价又由两个部分组成:针对学术性学科的必修模块内容的终结性评价,由教育行政部门组织与实施,结果作为学生能否毕业的依据之一;而针对学术性学科中的选修模块以及非学术性学科的评价,则可以采用灵活多样的评价方式,结果作为反映学生毕业水平的资料。高中新课程设置的模块大体可分为三种类型:一是基础型模块,主要体现各学科的基础知识基本技能;二是拓展型模块,旨在拓展学生的知识视野;三是活动型模块,主要目的在于训练学生的实践与动手能力。针对上述三种不同的模块内容,评价的方式可以分为两种:一种是传统的纸笔测验的方式,主要针对基础型模块;另一种是开放性考试,主要针对拓展型与活动型模块。模块成绩的认定应该由过程性的评价与终结性的评价的结果组成,两者应该分开报告。学分认定由学校自主实施,学生获得模块相应的学分,须具备两个条件,一是模块成绩评定合格;二是必须完成规定的学时数。学生毕业的标准也是必须满足两个条件:一是必须满足高中新课程方案提出的关于学分的总体要求,二是必须通过毕业水平考试。

 

    二、模块学业成绩评价的规划与实施

 

    在整个新课程背景下的高中学生学业评价体系中,模块学业成绩的评价是最为基础也最为常见的评价层面,通常也是学校和教师们最为关注的问题。下面从模块测验方案与测验试卷的编制、模块学习过程性评价的实施等三个方面阐述该层面学业成绩评价的规划与实施。

    1、模块测验方案如何编制?

    模块学习结束后,应该根据学生模块学习的总体表现,决定是否给予相应的学分。那么,怎样评价学生的模块学习表现呢?如前所述,对于选修模块,可以采用开放性考试的方式进行评价。而对于必修模块学习的评价,我们认为应该分为两个部分:一是终结性的模块测验,二是模块学习的过程性评价。

    要有效地实施模块学习的评价,应该事先拟定模块评价的方案。所谓模块评价方案,就是关于模块评价的目标、方法、工具以及结果使用等的一个实施计划。一般来说,一个完整的模块评价方案,应该包括模块测验方案和模块学习中的过程性评价方案两个内容。

    要想编制一份好的测验,应该首先编制一份好的测验方案。而一份好的测验方案至少应该具有如下一些内容:

    (1)测验目标:即根据新课程标准的教学目标要求,列出本模块的具体测验目标要求。

    (2)测验方式:即测验采取的方式,如笔试、口试、操作测验;全班同时进行、单独进行、分组进行等等;测验的时间、程序;如果测验包括一种以上的方式,必须说明各种方式测验的时间和程序。

    (3)测验工具:测验工具指测验所用的试卷(或试题),应说明试题的题型,各种类型试题比例,试题的难度要求。因为单纯用文字说明较难将问题交代清楚,可以结合例题加以说明。

    (4)评分方法:评分可以采用百分制或等级制的方法。根据新课程的理念,倡议使用等级制方法,使学生间的成绩差别保持在一个适当的程度,降低测验考试的负面影响。但要说明什么样的情况下可以得分,得多少分,多少分到多少分之间属于什么等级等等。

    (5)测验结果的解释和利用:简单说明测验结果的用途。例如:模块测验成绩为F的,必须补考,补考仍为F的,必须重修这一模块的课程。

    2、模块测验试卷如何编制?

    作为新课程背景下的学生学业水平测验工具,模块测验试卷的编制应该注意三个问题:一是注意把握试题的内容效度。这里的内容效度主要是指试题内容对于模块测验方案中拟定的测验目标的覆盖率。当前应该注意对于学生学习的过程、方法以及情感态度价值观的考查,尤其是对于某些适用的学科与模块内容,应该摸索出一些科学适用的考查方式来。但应该纠正一种错误的倾向:那就是人为地、生硬地编制一些所谓的“过程题”或者“价值题”,这种不顾学科特点与模块内容特点的形式主义做法是十分有害的。二是注意把握试卷的难度。作为一种水平测验,模块测验的难度要以本校的绝大多数的学生通过为标准,内容可以与高考的考试内容有关,但不应该按照高考的模式来实施模块测验,或者直接拿高考的一些试题进行模块测验,这种所谓“一步到位”的教学策略已在实践中证明是不可行的。三是注意把握试卷的题型结构。大家知道,不同的题型具有不同的考查功能,所以应该让试卷中出现按照一定比例搭配的各种题型,以全面考查学生的各种基础知识与基本技能,以及各种创造性思维等深层次的思维能力。当前应该着力研究开放性试题的编制方法及其评分策略,它是新课程背景下学业评价中的一个重点,也是必须攻克的一个难点。

    3、过程性评价如何实施?

    一般来说,模块学习的内容不多,时间较短。所以对于模块学习,尤其是必修模块学习中的过程性评价方案的编制,应该以简洁实用为原则。其内容一般包括:模块学习的过程性评价目标、方法、工具以及其它一些需要说明的问题。目前不少地区和学校采用的过程性评价量表就是一种可供选用的过程性评价工具,它既可以作为学生成长记录的一部分,也可以单独作为模块学习中的过程性评价工具使用。

    编制一份过程性评价量表,应该注意以下几点:一是评价的内容以模块测验中无法评价的内容为主,即主要评价学生的学习过程、学习方法与学习态度;二是评价的主体兼顾教师、学生与同学;三是评价的方式分为等级评定、资料呈现与文字描述三个部分;四是评价目标力求精练。本文附件是一份高中学生模块学习的过程性评价表样例,可供参考。

    在调查中我们发现,当前模块学习的过程性评价实践中出现了几种需要引起重视并加以克服的倾向:一是完全不做过程性评价。就是在模块成绩认定中,完全不考虑模块学习的过程性评价结果,仅以模块测验的成绩作为学分认定的唯一依据。究其根源,是对过程性评价的价值认识不到位,认为过程性评价没有太大的价值,可做可不做。其实,过程性评价在评价学生的学习态度、学习方式以及元认知水平方面,是终结性的模块测验所无法替代的。在高中学生模块成绩认定中,它绝不是一项可做可不做的事情,而是一件不仅要做,且必须要做好的事情。二是将阶段性考试代替过程性评价。其实质是将形成性评价代替过程性评价。形成性评价与过程性评价是两个不同的概念,其功能与作用是不一样的。作为形成性评价的阶段考试,其作用是检查学生在一个阶段的学习以后对所学知识的掌握情况,本质上与模块测验没有什么不同。因此,用阶段性考试代替过程性评价的做法也是必须纠正的。三是过程性评价过于烦琐。我们所看到的实验学校编制的过程性评价方案中,有不少方案过于烦琐。似乎过程性评价的方案越完整、越全面就越好。其实,一项好的过程性评价方案,首先必须是一个可以操作的方案。因为方案太烦琐,实施起来难度就会加大,久而久之,难以施行的过程性评价就会流于形式。在基本体现过程性评价功能的前提下,过程性评价方案应该以简单易行为原则。


   
    三、模块测验中开放性试题的命制与评分

 

    如果说,模块评价方案的编制是高中学生学业评价的核心与关键,那么可以说,开放性试题是当前高中学生学业评价研究中的热点与难点。说它热,是因为新课程强调要采用灵活多样的评价工具,注重考查学生思维的灵活性与创造性,开放性试题无疑是一个很好的选择;说它难,是因为开放性试题评分标准难以把握。在高利害的大规模选拔性考试中,开放性试题的评分往往容易引起争议。所以我们对开放性试题的编制与评分作了专题研究。下面是我们对开放性试题研究的部分感悟与体会。

    1、开放性试题有何价值?

    开放性试题是与封闭式试题相对应的一个概念,它具有一定的不确定性、主观性、模糊性。一般说来,封闭性试题具有确定的条件、确定的方法、确定的答案。而开放性试题则通常没有确定的条件、方法与答案。由于条件、方法与结果都具有不确定性,所以开放性试题又有多种不同的形式,如条件开放性试题、过程开放性试题、结论开放性试题以及上述几种开放方式的综合形式。如果说,封闭性试题在考查学生思维的严谨性、考查目标的客观性、考查方式的规范性上独具优势的话,那么开放性试题则在考查学生思维的灵活性、创造性上独具特色。应该说,两种试题各有优长,它们在考查功能上具有互补性。而我国目前学生学业评价的现状是:封闭性试题几乎一统天下,开放性试题几乎没有立足之地。近年来,虽然这种状况有所改变,但一来各个学科的改变的程度各不相同;二来总体上各个学科在运用开放性试题的问题上都没有太大的动作。特别是在一些较大规模的考试中,开放性试题的应用比例就更少。原因可能有很多,但最重要的一点,恐怕是对于开放性试题评分标准的把握上心中无数。因此,开放性试题的研究在目前的情况下,既十分必要又非常紧迫。

    2、开放性试题如何命制?

    根据我们的研究,开放性试题至少有如下一些命制方法与策略:

    一是陈题新用。就是将传统试题开放化。如:可以将传统试题中的部分条件省略,同时保留其它条件,从而形成新的条件开放性试题;也可以在传统试题中的解题方法上提出新的要求,如:要求用不同的方法求解,或用尽可能多的方法求解等等。

    二是从社会生活中寻找素材。这种设题方式的核心思想就是:从发生在学生身边的事件或者社会生活事实中,寻找出有一定开放性的问题出来。通常这些问题都是学生可以运用所学知识加以解决的,但又没有一个确定的答案。这类问题对于引导学生关心社会、学会生活有着较好的效果。

    三是设置黑箱式问题。所谓黑箱,简单地说,就是只有输入与输出,不知中间过程的系统。黑箱问题就是只有条件与结论,要求探究中间过程的问题。这种问题实质上属于过程开放性试题。它往往要求答题者发挥想象、做出种种猜测,并通过对各种猜测合理性的推理与判断,最终揭示出黑箱的内幕。黑箱问题在培养学生探究意识和能力上有着非常独特的效果。

    四是利用假设情景。假设情景是对实际生活中没有的,或者无法看到的情景做出假想,继而要求答题者以此假想为条件,做出判断与推理,最终得出相应的结论。如:“假如失去重力……”、“假如没有磨擦……”。这种假设情景虽然是现实生活中没有的,却不是没有意义的,因为科学研究往往是在接近这样的环境中进行的。

    五是利用自编试题。所谓自编试题,就是要求学生依据学过的某种原理或者基本思想,先自己编制一个试题,然后自己解答。这种问题看似简单,但如果学生没有很好的把握所学知识,则很难编制出好的试题来。实际上,这是一种条件、过程、结论全部开放的试题,我们可以称之为“全开放试题”,它对于学生的基础知识与想象力都有较好的考查效果。

    开放性试题命制中应该注意下面几个问题:一、为追求试题的综合性而牺牲测验的效度。比如:为了表现出考试方式的灵活性或者体现与其它学科、与社会生活的关联性,试题中出现太多的与该学科内容无关的内容,使真正属于该学科的东西占的比例很少。二、为追求试题的开放性而牺牲试题评分的可操作性。有人认为,开放性试题越开放越好。其实,开放性试题的开放度应该有一个限度,因为总体来说,越是开放的试题其评分标准的把握就越难,评分的误差也就越大。三、需要克服两种极端倾向:即忽视与过分夸大开放性试题的作用。当前两种倾向都有所表现,但主要的倾向是对开放性试题的重视不够。

    3、开放性试题如何评分?

    其实,开放性试题之难并不在于它的编制,而在于其评分标准的把握。所以开放性试题评分标准的研究就十分重要。国内的相关研究较少,而且已有研究大多停留在经验层面上,缺乏理论性和系统性。目前国外较有影响的开放性试题的评分方法主要有两种:一种是等级描述型的SOLO分类法;另一种是要素分析型的PTA量表法。前者从理论形态走向实践,后者则从实践上升为理论。两种评分方法都有着相当的理论研究与实践基础,可以为我们所用。现将两种评分方法简单介绍如下:

    (1) 等级描述型评定方法——SOLO分类法

    SOLO分类评价法由比格斯(Biggs)教授首倡,是一种以等级描述为基本特征的质性评价方法。已在大洋洲和东南亚地区经过广泛的实验和应用。

    SOLO分类评价法的基本理念源于皮亚杰的认知发展阶段论。皮亚杰的认知发展阶段论指出,儿童在成长的过程中认知的发展是有阶段性的,不同的阶段之间的认知水平有质的区别。比格斯和他的同事通过研究发现,人的认知不仅在总体上具有阶段性的特点,在对具体知识的认知过程中,也具有阶段性的特征。人在学习新知识过程中表现出来的思维阶段是可以观察到的,因此称为“可观察的学习成果结构(SOLO:Structure of the Observed Learning Outcome)”。也就是说,学生在具体知识的学习过程中,都要经历一个从量变到质变的过程,每发生一次跃变,学生在对于这一种知识的认知就进入更高一级的阶段,可以根据学生在回答问题时的表现来判断他所处的思维发展阶段,进而给予合理的评分。

    SOLO将学生学习的结果由低到高分为五个不同的层次,即:前结构(prestuctural)、单点结构(unistructural)、多点结构(multistructural)、关联结构(relational)、拓展抽象结构(extended abstract)等。这五种结构的基本含义如下。
前结构:没有形成对问题的理解,回答问题逻辑混乱,或同义反复;
单点结构:回答问题时,只能联系单一事件,找到一个线索就立即跳到结论上去;
多点结构:回答问题时,能联系多个孤立事件,但未形成相关问题的知识网络;
关联结构:回答问题时,能够联想多个事件,并能将多个事件联系起来;
拓展抽象结构:回答问题时,能够进行抽象概括,结论具有开放性,使得问题本身的意义得到拓展。 SOLO的五种层次代表了学生对于某项具体知识的掌握水平,从学生对某个问题的回答中,教师可以对照上述标准就学生对该项知识内容的掌握情况做出判断。因此,这种评价方式可以帮助教师进行教学诊断,同时,也可以向学生提供有用的反馈,所以SOLO分类法可以用于形成性的学生学业评价;另一方面,如果将上述五个层次赋予不同的等级分数,那么学生对问题回答的质量就可以被量化,量化的分数可以作为终结性评价的依据。依据SOLO编制评分标准,就是按照学生在具体学习任务中的行为表现,进行诸如前结构、单点结构、多点结构、关联结构和拓展抽象结构的水平划分,并对各个等级做出文字描述。若试题用于大规模考试,则还可以考虑按照实际评分的要求,将五个等级适当细化。

    (2)要素分析型评定方法——PTA量表法

    PTA量表是美国教师沃尔弗德与安迪生以及她们的同事所倡导和开发的一种对于学生作业、尤其是开放性作业的评分工具。PTA是英文Primary Trait Analysis 的缩写,意思是:基本要素分析。PTA量表是一种标准参照的评价工具,它确立的评分标准可以用来评价多种学生表现,如:英语口语、语文作文、实验操作、研究报告、艺术表演等等。PTA是一项具体任务,也就是说,对于每一个作业和测验有不同的标准。它既可以用于外部统一考试,也可以为课堂作业建立评价标准。

    PTA量表的理论假设则是:任何一种行为表现,包括行为的和认知的,都会有一系列基本的要素,这些要素构成学生学习某些知识、技能或行为表现的基本单元,只要找出这些基本单元,并将学生在这些基本单元上的行为表现做出准确的评定,则学生在完成这些具体任务时的总体特征就可以得到适当的评定。

    一般说来,制定PTA量表主要有三个步骤:一是确定可能对评价起重要作用的要素;二是编制测试学生每一个要素的评价量表;三是对量表进行试测与修改。

    PTA量表的编制过程则主要就是确定基本要素及其等级划分的过程,编制严格意义上的PTA量表,既依靠编制者以往的经验,也依靠同行间乃至师生间的交流与合作,它是一个不断循环、不断修正、不断完善的过程。在对于区分度要求不是很高的考试与评价情境中,PTA量表中各个要素的等级描述可以省略而代之以简单的等级数量。

    SOLO与PTA是从国外“引进”的评分方法,在我们的评价实践中具体运用时,应该注意两点:一是注意它们的适用范围。因为SOLO与PTA两种评分方法各有其能也有其不能。一般说来,SOLO更适合于论述型的开放性试题;而PTA则更适合于表现性、活动性、任务性的开放性试题。二是注意灵活运用,不机械照搬。具体说来,就是在使用方法上,既可以各自单独使用,也可以将两者综合起来使用;既可以完整使用,也可以部分使用或者简化使用。

    综上所述,新课程背景下的高中学生学业评价,应该立足于高中新课程的内容结构特点和高中学生的年龄特征进行总体设计与实施。在评价实践中,既要体现新课程倡导的评价理念,又要充分考虑评价方法的可操作性。截止目前,我们对于高中学生学业评价的总体框架、新课程背景下高中学生学业评价中的模块学业评价的组织与实施、过程性评价的内涵与方法、开放性试题的命制与评分等问题进行了初步研究,取得了一些有益的经验与研究成果,但当前高中新课程实验才刚刚启动,对于如何评价学生学业成绩这个问题,不论是在理论上还是实践上,都还有很多需要继续深入研究探讨的问题。比如:发展性评价的内涵与方法,开放性考试的组织与实施,过程性评价的具体方法与工具等等。这需要我们的教育理论工作者、评价专家、教学研究人员以及广大一线教师的共同探索和不懈努力。