初中生物学实施开放性考查的研究
 
番禺区教育局教研室    王孟富
 
摘要  本文就初中生物实施开放性考查这一项目开展研究。研究内容包括开放性考查的理论依据、开放性考查的组织过程、开放性考查的评价方法等。对于初中生物教师、初级中学行政领导、区县及地市级生物教研员正确认识和实施初中生物开放性考查,具有一定的参考价值。
 
关键词  初中生物学、开放性考查、组织与评价
 

国家《生物课程标准》提出了要培养学生具有社会责任感、创新精神和实践

能力的课程目标。初中生物实施开放式考查,可以激发学生学习生物学的兴趣、动机及求知欲,发展学生的创新能力和动手能力,培养学生创新精神和实践能力,是一项符合国家《生物课程标准》要求的考试评价制度改革。

 

一、开放性考查的理论依据

 

应试教育,对学生的学习评价,通常是采用单一的客观性测验,以一次性闭卷笔试成绩来评价学生的学习情况。这种教育评价方式对学生综合能力、个性特长等方面的评价则显出种种缺陷,它无法检查到学生的动手操作能力、语言表达能力、自主合作与探究能力等,而这些能力又恰好是学生在平时的学习中最突出、最重要的过程表现。初中生物实施开放性考查,实际上是对教育评价方法进行改革,改变以往的教学评价过分强调甄别与选拔功能,忽视改进与激励功能的状况,克服单一的客观性测验的缺陷,比较全面、恰当地评价学生的学习状况,并针对学生的优势和不足,给予学生具体的、有针对性的改进意见。这样,教学评价的方法将发生重要改变。所以,教学评价必须采用多种评价方法相结合的评价形式,来对学生的学习状况、行为表现进行全面评价。学校内所使用的教学评价方法通常有多种(见表1)。

1:教学评价方法分类比较表
分类
评价类型
评价的功能
工具举例
评价的性质
最佳表现
确定当尽最大努力时个体的表现。
能力倾向测验、成就测验
典型表现
确定在自然情境中个人将做什么。
态度、兴趣及个性调查表;观察法;同伴评价
评价的形式
客观性测验
对知识和技能的有效测量
标准化的选择题测验
表现性评价
在一定情境中,对个体在解决他自认为有价值的问题上的表现的测量。
动手的实验室实验、设计、论文、口头表达
在教学中的用途
安置性
确定必需的准备技能、对课程目标的掌握程度和最佳学习模式
预备测验、能力倾向测验、对课程目标的预测、自陈量表、观察法
形成性
确定学业进展、提供反馈以强化学习、并纠正学习错误。
教师自编的测验、教科书出版者应教师要求特制的测验、观察法
诊断性
确定造成持续学习困难的原因(智力的、生理的、情感的、环境的)
出版的诊断测验、教师自编的诊断测验、观察法
总结性
确定课程结束时的成就,其目的是打分或证明对目标的掌握
教师自编的调查测验、表现性评价、作品评价
解释结果的方法
标准参照
依据明确定义的学习任务(如个位整数相加)的具体范围对学生表现进行描述
教师自编的测验、向教科书出版者定制的测验、观察法
常模参照
依据在已知群体中的相对位置(如在30人的班里排名第(10)对学生表现进行描述。
标准化的能力倾向测验和成就测验、教师自编调查测验、兴趣调查表、适应性调查表
上表中列出了教学评价的分类方法。初中生物实施开放性考查提出了评价学生学习表现的一种全新途径。如果从评价的性质来看,它比较注重学生学习的典型表现;如果从评价的形式上来看,它比较注重表现性评价;如果从在教学中的用途来看,它比较注重形成性和总结性评价相结合;如果从解释结果的方法上来看,它比较注重标准参照。下面我们来重点讨论初中生物实施开放性考查的评价形式方面的问题。显然,客观性测验与表现性评价各有自身的优点(见表2)。
2:客观性测验和表现性评价的比较表
比较
要素
客观性测验
表现性评价
测量的学习成果
能有效地测量事实性知识。某些题型(如选择题)也能够测量理解、思维技能和其他复杂的学习成果。但不适合测量选择和组织观点的技能、写作能力或某些问题解决技能。
能够测量理解、思维技能和其他复杂的学习成果(尤其是创性)。测量与现实贴近的教学目标比较有效,但不适合用来测量事实性知识。
问题的准备
测验所需的题目总数很大,准备耗时且难度大。
只需几个任务。
课程内容取样
因为测验中所包含的题目较多,所以能够获得广泛的样本。
课程内容的取样由于评定中包含的任务有限而受到限制。
对学生反应的控制
完全结构化的任务限制了学生反应的类型,能防止欺骗行为的出现及写作技能的影响,尽管选择题有猜测的嫌疑。
可以按照自己的方式自由反应,使学生的创造力得以表现,而且使猜测的可能性最小化。
评分
客观
主观判断评分
对学习的影响
通常鼓励学生对具体的细节有全面的掌握,并且能够区分细节。如果设计得好还可以鼓励学生发展理解力、思维能力以及其他复杂的学习成果。
鼓励学生关注大的内容单元,并特别强调组织、整合及有效表达思想的能力。
 
信度
测验设计得越严谨信度越高。
信度通常较低,主要是因为评分
标准不一致,任务样本有限。
举例
选择题、简答题、判断题、匹配题、解释性练习等。
论述题,口头交流,构建模型、表格、图表,工具和仪器使用等。
客观性测验与表现性评价都能提供有价值的关于学生成就的证据,它们也都有自己的长处和不足。所以,有些情况下使用客观性测验是恰当的,而在另一些情况下,使用表现性评价则更合适。考虑到这两者的相对优势,我们必须警惕不要陷入到非此即彼的思路中去,也就是说要么只用客观题性测验,要么就只用表现性评价。最好是兼收并蓄,每一种都用来测量各自最适合的学习成果。这对学生的学习将产生积极的影响,因为在备考时,学生必须留心客观性测验要考查的具体学习成果,而且还要关注表现性评价所测量的综合的表现性学习成果。所以,初中生物实施开放性考查,比较提倡表现性评价,但它并不排斥客观题性测验,而是对客观题性测验的不足加以弥补。
20世纪90年代开始,许多教育决策人员十分钟情于表现性评价。表现性评价通过让学生学会完成某一特定的任务来测量学生的学习状态。尽管学生在做一道判断题时也是在完成任务,但是,这种任务与表现性评价中所指的任务是不同的。表现性评价提倡在学生完成某项任务的过程中,不仅要观察学生的表现,还要对学生的表现做出评判。
表现性评价提供了一种评价学生多种表现的手段。这些表现包括论述、口头交流,构建模型、表格、图表或者地图,工具和仪器(打字机、计算机、科学仪器或音乐器械)的使用等。它既可以评价学生行为表现的过程,又可以评价学生行为表现的结果。不像对事实性知识的简单测试,表现性评价很少有单一正确的或最佳的答案。而且,有多种行为表现和问题的解决方案都可以被评定为优秀。

根据学生反应的自由度的大小,表现性评价还可以划分为限制型表现性评价

和扩展型表现性评价。限制型表现性评价的结构性较强,提高了评价的可靠性并拓宽了评价内容的覆盖面。扩展型表现性评价最适合于测量诸如收集、组织、综合、评价和呈现信息等较为复杂的学习结果。扩展型表现性评价的局限性主要表现在评价结果的可靠性不高,以及任务完成与评价都很费时间。

据此,我们可以理解,初中生物实施开放性考查,也应根据学生反应的自由

度的大小来作出评判。既可以采用限制型表现性评价,也可以采用扩展型表现性评价,还可以采用限制型表现性评价和扩展型表现性评价相结合的方法。比如,教师可以规定哪几个学生完成哪几类作品,也可以不作任何规定,任由学生自由组合、自主选择地完成某一件作品。或者要求学生必须完成规定作品一件,任选作品一件。到底采用哪种方式,就应该交给我们第一线的教师自己去选择。

 

二、开放性考查的组织过程

 

由于开放性考查在形式上有其自身特点,这就决定了它的组织过程的特殊性。一方面,开放性考查强调其考试特征,必须是特定年级的所有学生均须参加这一评价项目。例如,2003学年下学期广州市中学生物科出台了在初二、初一年级统一考试中实行新的考试评价方案的通知。其评价方案的具体操作要求为:初二、初一年级生物学考试均由三种形式组成:平时成绩、纸笔测试、开放性考查。学生学年成绩计算方法为:学生学年成绩=平时成绩(10+纸笔测试(60+开放性考查(30)。而且纸笔测试的分值只有60分总分。如果某位学生不参加开放性考查,他所缺的30分就无法计入学期成绩和学年成绩中去。所以,特定年级的所有学生均须参加开放性考查。

另一方面,开放性考查还强调其过程的自主性、合作性。开放性考查作品可以是学生独立完成,也可以是小组合作完成。这说明它又不同于平时所说的闭卷或开卷测验与考试。因为测试都要求学生能够独立完成规定的测试题目。而在开放性考查方面,学生可以比较自主地选择他所要开展的研究内容。

(一)开放性考查的内容  要体现多样性和供选择性,体现学生的多元智力、加强教师教学的弹性等。

1. 供选择的项目  近两年来,广州市开放性考查的题目有一定的规定,但

从整体上来看,给学生选择的自由度还是很大的。学生可以从这些类别中任意选择自己比较喜欢或比较有技术能力解决的项目(见表3)

3:初中生物开放性考查中供学生选择的项目

项目

调查类

计算机应用类

操作类

文字类

举例

近视眼调查

遗传病调查

校园环境调查等等

课件

网页制作

等等

生物实验操作

生物实验改进

小制作等等

小论文

手抄报

等等

2.作品制作要求  每位学生只需从上述四个项目中选择一项。可以独立完成,也可以小组合作完成,每小组5人或以下。每件作品必须附上作者的设计意图及简短体会(作品完成过程中遇到的困难、是如何解决的、最终的收获等)。可以嵌入作品中的(如调查类、某些计算机应用类、小论文等),则直接以体会栏目放入作品,不能嵌入作品中的(如某些小制作、手抄报等),则用B5纸打印,随作品一起上交。计算机作品须交光盘和打印件。

(二)开放性考查的组织过程  分为班级组织发动与实施、年级或学校组织评比、区县级组织和地市级组织评比

1、班级组织发动与实施  这是最基本的组织单元。它规定了学生参与考查

的时间范围,学生参与形式,学生作品内容,作品制作方法,作品质量要求,评比规则等。科任教师是该项目的组织与监督实施者。科任教师必须提前23个月的时间,根据广州市开放性考查的内容要求,将考试任务布置下去。这种任务既可以采用限制型表现性评价,也可以采用扩展型表现性评价,还可以采用限制型表现性评价和扩展型表现性评价相结合的方法。下面提供某校一位老师[注]的组织与发动的案例片段。她是采用限制型表现性评价的方法

片段一:

师:同学们,开放性考查的类型有调查类、计算机应用类、操作类、文字类四大类型。开学初期,老师已经布置你们自由分组,着手选择作品的类型,作好材料的准备工作等。大家准备得怎样了?我们今天这节课,不是给你们用来做作品的,而是专门让你们针对自己已做的计划,再来一次讨论和交流,希望得到一个比较完整的工作计划。在分小组讨论后,填写好以下表格(见表4),一式两份,一份上交老师,一份自己小组保管,时间为20分钟。

4:针对学生而设计的分组表格

项目

填写内容

制作目的

 

作品名称

 

作品类型

 

组内分工情况

 

组员名单、学号

 

组长姓名

 

上交时间

 

备注

 

生:“我负责画画。”“我负责找资料……”

生:“谁来当组长,投票吧!”“组长我来当……

……

学生们兴致十足地热烈讨论自己所要开展的项目。

评析:1、课时安排:这节课不能安排在开学初布置考查作业的课堂上,因为学生还没有

选材,更没有选择分组的合作伙伴,往往讨论时还未落实到重点,就已经差不多要到下课的时间,比较难以达到预期的效果;也不能安排在第六周后,因为这样会导致学生做作品的时间不充足,也不可能做出好作品。所以这节课最好安排在第二至第三周为宜。2、课前分组就座的好处:分组和选材在布置考查作业时将任务安排班干协助老师登记,课前已按自由组合的小组就座,节约了时间,提高了该课的效率。3、计划表格内容要求填写的好处:老师精心设计考查计划的模式,能在学生明白到做每件事前,要有一个具体的计划,把将要做的事情、次序转变为文字,既可以提高自己的办事效率,也可以锻炼学生学会条理性地安排工作,减少盲目乱做、丢三拉四的习惯;这张表格把各小组学生的名字、学号登记好,方便一个老师评价数百学生,节约老师的教学工作量。4、学生分组自由讨论既能提高这次考查的积极性,更重要的是让学生通过交流懂得如何与同学相处、合作。

片段二:

在很多小组成员进行激烈讨论的同时,也有这样的小组:“老师,你可以帮我们选个内容吗?”而且每个班上总有一两个学生在班集体中长期备受冷落,无人愿意跟他们合作,他们茫然的神态与其他组激烈的场面形成鲜明的对比。这时,老师应进行适当的提示。

师:这次考查的目的是什么呢?怎样去选定你们的主题?我们已经把初中生物的大部分

的知识学过了,每个同学感兴趣的都不一样,是吗?举个例子,我们做过近视眼调查,很多同学认为如果再选择这个主题不是重复了,没有什么创意?但我们调查的学校各年级的近视发病率和近视的原因主要是与学生看电视、玩游戏机有关,但你们却没有调查这些新增的近视。还有,同学的饭食是怎样的?近视与饭食有关系吗?……同一个对象,高矮不同的人看到的不一样,同一身高在不同的角度看到的也不一样?……

生:各小组的同学又嗡嗡地讨论,“运动与近视有关系吗?”……

师:“同学们,这个考查提供了一个你们尽情发挥的空间,在选材上必须是你们真正感

兴趣的,想更深入了解有关这方面的内容,综合你们的最优越的方式向老师和同学展示,而不是满足老师的兴趣,明白吗?千万不要做别人观点的报道员!老师相信你们每个同学绝对有这个能力完成这个考查。另外,这份计划有个备注栏,是留给你们小组遇到不能解决的问题时,方便向老师留言的。还有15分钟,得抓紧啦!”
    ……

生:“老师,我们想制作叶片的形状,帮我们想一想方法,叶片中的水分怎样快速去掉

而又不会损坏其本来的形状?”

生:“老师,我最喜欢种花,如果我把家中亲手栽种的花带回来行吗?”一个长期在同

学心目中没有地位的同学小声地问。

师:“当然可以,老师建议你,把你整个栽种花的过程写下来和老师一起分享,好吗?”

生:“我一定把种得最好的花带回来!”满脸的喜悦。

……

评析:1、老师的宏观调控非常重要,因为学生对每件事所想的和做出的结果往往是很

难预期的。适当的点拨,可以启发学生思路,要引导学生从不同的方面看待问题,注重个人的特色,不会盲目抄袭别人。2、开放性考查提供了学生可“做”的空间,而不是老师可“教”的内容。如果老师过多地干涉,就会与这个考查的目的相违背,而且学生做出的作品也有可能千篇一律,没有创新可言。所以教师在这里要尊重学生,让学生自主选材。3、老师的肯定,是最大的鼓舞,这就是这种开放性考查的魅力所在,让这个备受歧视的同学尝到了成功、让人欣赏的体验。

2、年级或学校组织评比  由学校或年级备课组教师制订作品评比规则,将

学生作品集中展览。由专任教师和学生分别参与评价,对每件作品打分。若某件作品的评分为28分,则参与该件作品的学生的得分应为28分左右。为什么会有差异?因为还应根据学生自评、互评和任课教师评价的差异来确定每位学生的得分。学生参加开放性考查的成绩,应计入学期和学年档案。年级或学校组织评比,还有一项重要目的,就是要挑选优秀作品参加区县和地市级的优秀作品评比。

3、区县级组织评比  区县级组织评比包括作品收集,展厅布置,评委打分,作品成绩统计等。为了评委打分和统计的方便,应该统一各学校送展作品的数量与标签的规格,还有作品编号、电子表格规格、作品上送要求、时间、地点、送展作品的学校代号等。区县级组织评比还要求成立专门的专家评审组,一般由本区特约教研员和骨干教师组成。他们在全区(县)教学中具有一定的影响力。区县级组织评比后将推荐优秀作品,参加地市级组织的评比。区县级组织评比后还要将评比结果加以公布,并对优秀作品制作者和辅导老师颁发证书。如2003年区县级要求上报的电子表格规格(见表5)。

5:区县级要求上报的电子表格规格

学校名称

作品代号

作品类别

作品类别代号

        

作者

指导老师

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

又如2004区县级组织初二生物开放性考查,学生作品评比结果的有关公告是:本学期广州市初中生物学开放性考查如期进行,要求全体学生参与。各校积极组织,认真实践,精心评选出能够代表本校较高水平的作品,参加区级评比。区级评比共收到各校推荐的学生作品359件。区级评审组分为计算机作品类评审组和文字制作类评审组。评委由区特约教研员、骨干教师组成。评委评分持续了一整天。经过各位评委认真、细致的评比,将其结果等级化,再经过统计学处理,得到每件作品应得的最终评价等级。全区初一分别评出学生作品的一、二、三等奖共232件(获奖率64.6%,具体名单另附)。现将开放性学生作品的评比结果公布如下(见表6)。

6:学生开放性考查作品的评比结果

类别

调查类

计算机应用类

操作类

文字类

合计

累计

一等

7

7

18

17

49

232(获奖率64.6%

二等

4

10

18

27

59

三等

5

17

29

73

124

我们根据有关文件要求,把获得区级一等奖的部分优秀学生作品上送到广州市参加地市级的评比。

4、地市级组织评比  由地市级教研部门组织实施。包括作品收集、编号,展厅布置,评委打分,作品成绩统计等。最后公布学生作品的评比结果。对获得优异成绩的学生、学校、区县和辅导老师提出表扬并颁发荣誉证书。

 

三、开放性考查的评价方法

 

初中生物实施开放性考查的评价,要力求体现教学评价的灵活性、考查内容的多样性和供选择性,体现学生的多元智力、加强教师教学的弹性等功能特征。教师和学生要参考一定的评价量化表,来对学生作品进行统一的评价和打分。实际操作中使用两种评价量表,分别用于班级或年级评价、区县级或市级评价

(一) 开放性考查的基本价值取向

基于新课程理念和教学价值观,我们可以理解,初中生物实施开放性考查,

实际上是对教学评价进行改革的一种尝试。应该坚持如下的基本价值取向:
1
.评价不仅具有诊断、甄别、管理和激励的功能,而且还应具备导向、调

控和促进发展等多方面的功能。全市初中生物实施开放性考查,即是以促进教师

的专业发展,促进学生多种能力的形成为主要目的。

2.初中生物实施开放性考查,是评价者与评价对象对教学活动的一种互动的认识过程,其评价主体是多元的,评价者和评价对象是一种“交互主体”的关系。因此,要重视和强调评价对象的主体意识和积极参与,把评价过程看成是评价者和评价对象协商、交往和发展的互动过程。

3.初中生物实施开放性考查不但要重视对结果的评价,而且更关注事物的发展过程。因此,对于班级范围的评价,不仅要关注质量效果,而且要关注学生参与的计划,教学的实施与体会,强调对教学过程的整体评价。

4初中生物实施开放性考查的评价过程,必须建立在客观事实的基础上。对于班级范围的评价,要努力追求评价的真实性和有效性,通过自评、他评和互评,通过研讨、对话和反思,从而了解事实、认识自己、获得改进和发展。

(二)开放性考查的评价指标体系
建立评价指标体系,既是评价工作的基础,又是评价工作的核心,假若没有

指标体系,评价工作就会无从入手,人们就不清楚要评什么,不评什么,应该重视什么,忽略什么。初中生物实施开放性考查的评价指标体系建立的原则是:

1、导向性原则  初中生物实施开放性考查以促进师生发展为宗旨。具有注重教学过程、强调质性评价,提倡评价目标与主体多元,强调参与和互动,关注个体差异等特征,因此,在建立评价指标体系过程中必须体现发展性教学评价的理念与观点,按此建立起来的评价指标体系不仅是评价者评价的依据,而且是被评价者设置活动计划、培养科学思想、改进学习方法、提高学习能力和行为的参照物,具有一定的导向性。

2.科学性原则  初中生物实施开放性考查有其内在的规律,要进行要素分析或过程分析,建立指标体系,实施评价时要遵循其自身的内在规律,突出评价活动的主要特征。建立指标体系要有统一的分类基准,各项指标之间互不相容,不重叠,不交叉,提高评价的信度与效度。

3.简约性原则  初中生物实施开放性考查是一个多要素组成的复杂系统,又是一个动态的生成过程,评价很难全部反映这个过程的诸多因素及所有情况。因此,设计评价指标体系时要抓住主要矛盾,突出评价重点,而不应该面面俱到。内容要简约,便于理解和操作。

(三)开放性考查的评价量表

使用的评价量表分为班级或年级评价量表、区县级或市级评价量表。前者不

但可以对学生的考试作品的质量加以评价,还可以对学生参与开放性考查的过程加以评价;但是后者只能对学生的考试作品的质量高低加以评价,而对学生参与开放性考查的过程却没有加以评价的可能性。

    1、班级或年级评价量表  评价项目包括科学性、创造性、艺术性、独立工作与合作能力、交流和表达能力等。学生本人、小组成员、教师应根据这些项目

来打分。以体现教学评价的多元化。自评、小组互评、教师评分可依据如下评价量表(见表7)。

               

考查项目:                    内容:                                       

初中    年级    小组成员:                        指导教师:           

评价项目

权重

评价标准

自评

小组互评

教师

评分

科学性

7

1)观点、内容、方法正确

2 结合学科实际、有事实依据

3)用词恰当、文字通顺

 

 

 

创造性

7

1 能独立思考、有自己的见解

2 能联系日常生活或社会实际

 

 

 

艺术性

6

布局合理,版面美观、整洁

 

 

 

独立工作、合作能力

4

 

 

 

 

交流和表达

4

 

 

 

 

其他

2

 

 

 

 

合计

30

 

 

 

 

 

 
7:班级或年级评价量表

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 


学校教师或学生可以参考此量表,对每件学生作品打分。由于本表的权重是采用连续的数字计分,所以,可以简单地将计算出的算术平均数作为某件学生作品最后的得分。这就是参与该件作品制作的所有学生的团体分数,但并不代表每位学生都是这个分数。因为具体到某位学生的开放性考查的分数,还应根据小组内学生自评、互评和任课教师评价的差异来讨论确定是增加、不变还是减少,从而得出每位学生的最终考查成绩。可以把学生参加开放性考查的最终成绩,计入学生学期和学年成绩而存档。

2、区县级或市级评价量表  评价项目包括科学性、创造性、艺术性。由于本量表采用等级计分方法,所以,对每位评委给学生作品的评定分数不能以简单的数字相加来求平均数的方法。而应该运用教育统计学的方法来解决这一问题。区县级或市级可使用的评价量表如下(见表8)。

8:区县级评价量表

评价项目

评价标准

等级

科学性

(1)    观点、内容、方法正确

(2)    结合学科实际、有事实依据

(3)    用词恰当、文字通顺

 

优秀

 

良好

 

中等

 

 

较差

 

 

创造性

(1)    能独立思考、有自己的见解

(2)    能联系日常生活或社会实际

艺术性

1)布局(制作)合理,

2)版面(制作)美观、整洁

    (四)开放性考查的数据统计

班级评分表的数据统计比较简单。可以将每张表的自评分、小组互评分、教师评分的合计分数相加,除以3,即得到每件作品的得分。每班可以将得高分的作品送校参评。

校级评比时可以分为教师投票与学生投票。计算出教师或学生投票所得平均分即是该件作品的得分。从而评出学生作品的一、二、三等奖。并选送最佳作品送区县参评。

区县级或市级评价量表的统计比较复杂。由于每次开放性考查作品评比,一般是每组特邀评委34人,而且对每件作品的评价分别以“优”、“良”、“中”、“较差”、“差”表示。这样,每位评委给作品的评价,是等级分。按照教育统计学原理,等级分的统计不能简单地相加去求算术平均数,而要运用教育统计学的方法加以处理。

1、学生作品成绩的计算方法  我们可以使用“平均等级的数量化分数”的方法。这是因为,有时对某些作品或事物的评定,虽然有严格的频度标准,但它却不象对理科作业评定那样,对于答案的正误、优劣有十分明确的界限。由于受到评定者主观因素(如审美观或对评分标准的把握不完全相同)的影响,对同一作品或事物,不同的评定者会给予不同的评定等级。在这种情况下,可将几位老师的评定等级转化为数量化分数,用他们所评定的等级数量化分数的平均数来表示一个学生的评定成绩。这样,每个学生的作业成绩就可以相互比较了。

比如说,群体中,若甲、乙、丙三位教师分别给A作品评定为优、良、中三个等级,B作品评定为良、优、中三个等级,请说明那件作品更好一些?

表面上看来,两件作品各得到三位评委优、良、中三个等级各一次,其成绩是一样的。其实不然。因为如果把这个问题放在教育统计学的角度来考虑,情形就完全不一样了。我们可以看下面的例子。

例如、2003年开放性考查之作品评比活动中,三位教师对120个编号连续的学生计算机作品的等级评定情况见表9

9:三位教师对120个编号连续的学生作品的等级评定情况

等级

各位教师所评定的作品数

教师甲

教师乙

教师丙

较差

30

60

15

15

0

12

30

36

30

12

0

36

60

24

0

总和

120

120

120

 

 
 

 

 

 

 

 

 

 

 

 


请将表中数值转化成数量化分数。

若甲、乙、丙三位教师分别给A作品评定为优、良、中三个等级,B作品评定为良、优、中三个等级,请计算AB两个作品平均等级的数量化分数,并说明那件作品的成绩更高一些。

这是一个典型的教育统计学问题。依据教育统计学原理,我们可以将教师甲的评价数据作如下几步的计算。

(1)    计算教师甲所评定的各等级人数比率,见表10中第(3)列;

(2)    计算本组1/2面积与本组以下面积之和,见表10中第(4)列;

(3)    计算本组面积的平分点至Z=0之间的面积,即表10中第(4)列的各

组数值与0.5之差,见表10中第(5)列;

    4)求平分各块面积的中位数(即等级数量化分数),见表10中第(6)列。

10:等级数量化分数的计算表

评定的

等级

1

评定者(教师甲)

人数

2

比率

3

本组1/2面积和

4

本组1/2Z=0之间的面积

5

等级数量

化分数

6

较差

30

60

15

15

0

0.  25000

0.  50000

0.  12500

0.  12500

 

0.  87500

0.  50000

0.  18750

0.  06250

 

0.  37500

0.  00000

0.  31250

0.  43750

 

1.15

0.00

0.89

1.53

 

总和

120

 

 

 

 

 

 
 

 

 

 

 

 

 

 

 

 

 

 


同理,可以将乙、丙两位教师的评价数据计算成等级数量化分数(过程略)。于是,我们得到表11的数据:

11:三位教师对40件学生作品评价的各等级数量化分数表:

教师

各等级数量化分数

较差

1.  15

1.  64

 

0.  00

0.  76

104

0.89

  0.00

0.13

1.53

  0.76

1.28

0.64

 

 
 

 

 

 

 

 

 


A作品被评定为优、良、中三个等级,我们可以求得其平均等级的数量化分数为:(115+0.760.13÷3 = 0.59

B作品被评定为良、优、中三个等级,我们可以求得其平均等级的数量化分数为:(000+1.640.13÷3 = 0.50

所以,两作品相比,A的质量要优于B

这是因为在正态分布上,A作品Z = 0.59 之下的面积0.722240(查正态分布表,得P = 0.222240,再加0.5 )大于B作品 Z = 0.50 之下的面积0.691460(查正态分布表,得P = 0.191460,再加0.5 )。

显然,比照上述方法,我们可以将上面问题中的120件作品分别计算出平均等级的数量化分数。不过,这一计算过程比较繁杂。我们不妨借助计算机来完成这一工作,并将每件作品的平均等级的数量化分数从大到小排列,从而可以知道120件作品从优到劣的排序。据此排序,我们可以确定每件学生作品的评价等级。

区级评比中,通常有300500件学生作品参评。依此方法,可以确定每件学生作品的评价等级。

2、对评价者的评价  这一问题的提出,源于某位教师的一封投诉信。该位教师认为他所选送的学生作品质量很高,却被评委评定为二等奖,而另一位教师所选送的学生作品,质量一般却被评定为一等奖。实际上,他对评审小组成员的评定结果是否公平提出了质疑。因此,应该对这个问题进行恰当的解释。

区级评选由本区初中生物骨干教师组成评委会,分初一组、初二组、计算机组。教研员负责监督和各组协调工作。各位评委均按评价量表,本着认真、负责的态度,对入围作品一个一个,独立评分,不存在故意或有目的的集体拉抬与压低。但是,由于每位评委对评价标准的理解与把握不同,评价结果是有差异的。而且,每位评委评出的各等级学生作品的数量也有差异。这在教育评价上,应该视为是允许的。但是,对评价者的评价的一致性问题的确值得探讨。

在统计学上,两个变量之间不精确、不稳定的变化关系,称为相关关系。它既表现在变化方向上,又表现在变化程度上。当两个(两个或以上)变量值以等级次序排列或以等级次序表示,描述这几个变量之间的一致性程度的量,称为肯德尔和谐系数。它通常用来表示几个评定者对同一组学生学习成绩等级评定的一致性程度。因为在对学生作品的评价方法上,同一位评定者对所有被评事物的评定允许有相同等级,所以,可以采用对肯德尔和谐系数进行校正的方法。

例如,以上述投诉中提到的对一等奖有疑问的学生作品为中间项,抽取前后序列中连续5份,得其等级评定结果如表11中(1)、(2)列。

试问三位教师评定结果的相关程度如何?

对于这个问题,可按如下方法解答。

(一)计算如下数据:

(1)    赋予等级:共有5件作品,其排名应为12345。第一位评委

2号作品最1等,则2号作品实际排名为1;给34号作品并列2等,其理论等级应为第2或第3,则34号作品的实际排名均为(2+3÷2=2.5;而15号作品并列3等,其理论等级应为45,则其实际排名均为(4+5÷2=4.5。同理,可求得第二、三位评委给5件作品的实际排名,得到表12中第(3)列。我们还可以先后计算出RR2 于是得到表12中第(4)、(5)列。

12:三位教师对连续5份学生作品的等级评定结果表

学生作品

n = 5

(1)

评委K = 3

(2)

实际排名(等级)

3

R

(4)

R2

(5)

1      2      3

1      2      3

   1

   2

   3

   4

   5

  3      5      3

  1      2      2

  2      1      1

2      3      2

  3      4      3

4.5    5      4.5

1 ..    2      2.5

2.5    1      1

2.5    3      2.5

4.5    4      4.5

14

 5.5

 4.5

8

 13.5

142

5.52

 4.52

   82

  13.52

总和

 

 

..45.5

492.75

 

 
 

 

 

 

 

 

 

 

 

 

 


2)计算SSR

SSR = ΣR2–(ΣR2/ n = 492.75 45.52/5 = 78.7

3)计算ΣT :(运用公式T =Σm3–m÷12,m表示相同等级的个数)

第二位评委的评价中没有相同等级,则T 2 = 0;第一、三位评委的评价中有22相同,23相同,则:T 1 = T 3 =23–2÷12 +23–2÷12 = 1

于是ΣT = T 1 + T 2  + T 3  = 1 + 0 + 1 = 2。

4)求校正的肯德尔和谐系数:

              SSR                            78.7

rw = ———————————— = —————————— = 0.937

      (1/12)×K2×(n3-n)K×ΣT     (1/12)×32 ×(53-5)-3×2

(二)相关系数的显著性检验:

(1)    提出假设: H 0 :ρ= 0(无相关性)  H 1 :ρ0(有相关性)

(2)    计算检验统计量的值:

检验统计量为:X2 = K(n-1) rw = 3×(5-1)×0.937 = 11.24*

(3)    统计决断:

根据自由度df = n -1 = 5 - 1 = 4 ,查X2值表,寻得0.05及0.01显著性水

平的X2临界值分别为X2(4)0.05 =9.49 ,X2(4)0.01 =13.28 ,而实际计算出的X2 =11.24*X2(4)0.05 =9.49<11.24*<13.28 = X2(4)0.01 。根据X2检验统计决断规则,0.01<P<0.05,于是在0.05显著性水平上拒绝H 0而接受H 1 ,其结论为:三位教师对5件作品的等级评定结果从整体上说是一致的(相关的),此结论的可靠度为95% 。同理,还可以以投诉者所选送的作品为中间项,抽取前后序列中连续的5份,再进行统计检验,事实说明,各位评委的评价结果从整体上说也是一致的。这样,对投诉者提出的疑问就可以作出恰当的解释。

    区级开放性考查作品评比,必须对各评审小组的评审结果进行相关性检验。

 

四、问题与展望

 

在两年的实践活动中,我们发现,初中生物学实施开放性考查,也出现了一些问题,这些问题虽然并不会影响其功能特性,但的确也是需要解决的。

1)某些学校的生物教师的教学态度还不端正,没有完全树立素质教育的思想观,搞应付式教学。初中生物学实施开放性考查,提倡教学评价的多样化,要求全体学生参与,但某些学校只是部分学生参与,指定一些学生制作作品,参加区级评比。把这项活动当成学科竞赛来对待。或者还在搞应试教育,根本不组织参与该项活动,只把纸笔测试的成绩(60分)转化成百分制,当成学生的学期或学年成绩。而初级中学的数量多,市、区两级教研室又无法进行全面监控。

2)由于生物学是非中考科目,某些学校领导对生物学科重视不够,一方面专业教师配备不够,教师的专业素质跟不上,无法对学生参与开放性考查进行积极的、有效的专业指导;或者学校受到资金的限制,生物教学设备严重短缺,无法让学生开展积极有效的教学活动;还有的学校领导打击教师的教学积极性,认为初中生物实施开放性考查,占用了学生的课外时间,怕影响到中考科目的考试成绩。

3)组织工作难度大。比如说学生是在课外开展活动的,给老师、班级和学校的教学组织带来较大困难;有些野外活动还担心学生的安全问题;学生的自评、互评和教师评价时,数据量大,统计起来相对比较麻烦;学生学籍册还是以前印制的,还没有设置对学生学习过程性评价的相关栏目,在许多学校,学生的成长记录袋还没有建立。每年组织这一活动,需要花费很多的人力、物力、财力。

对于区县级评比来讲,每年面对初一、初二年级近千件参评作品,要组织搞好评审和展览工作,的确感觉工作量很大。

    4)某些学生参与该项活动,有点象研究性学习或学生综合实践活动,如某学校对当地红树林的调查报告,完全可以看成是一项综合实践活动。但初中生物学实施开放性考查,其性质与研究性学习或学生综合实践活动的关系怎样?怎样去处理好这种关系?或者是否可以将二者整合起来?给我们提出了新的研究课题。

5)目前,多数教师均采用限制型表现性评价的方法。其实还可以采用扩展型表现性评价,也可以采用限制型表现性评价和扩展型表现性评价相结合的方法。教学中采用哪种方法更好?给教学提出了新的研究问题。第一线的教师是否应该需要开展专项对比研究?

虽然上述五个方面的问题的确存在,有的问题甚至还比较突出。但是这些问题并不能掩盖初中生物学实施开放性考查的许多优势。这里应该明确指出,无论这些问题有多少,困难有多大,我们必须理解,开放性考查是一新生事物,它在初中生物教学中的评价功能是以往的应试教育不可比拟的。这一新的教学评价方式的完善也需要有一个过程,需要我们不畏艰难,积极探索,找寻出解决这些问题的有效途径和办法。

初中生物学实施开放性考查是一项具有积极意义的教学评价活动。正如那位投诉者所说:“其实施,使学生摆脱了课本的束缚,丰富了学生课余生活,教学评价模式由单一的闭卷考试转移到了全面性地考查学生综合能力,使教学走出了应试教育的怪圈。作为生物学科,客观上就要求学生去操作、去体验,不但提高了学生的操作水平,提供了同兄弟学校交流的机会,而且客观上对我们指导老师的指导水平也提出了新的要求。”

新一轮国家基础教育课程改革是进一步推进素质教育的一项重要举措,是广大教育工作者和全社会十分关注的问题,我省于2003年秋季在九年义务教育阶段起始年级、起始学科已全面实施新课程标准新教材教学,2004年秋季开始,高中阶段起始年级也已全面实施新课标。初中生物学实施开放性考查,顺应了新一轮课程改革的发展潮流,不但使教学评价的形式多样化,而且还促进了学生学习的全面发展和教师的专业发展。因此,该项教学评价活动的深入开展,必将对学生的学习行为和教师的教学行为产生深远的积极影响。

 

[注]该案例片段取自石基二中凌紫珊老师“生物学科中开放性考查课堂实录”一文。特此致谢!

 

主要参考文献:
1.   王斌华著,发展性教师评价制度,华东师范大学出版社1998年10月第1版。
2.   陈向明著,教师如何作质的研究,教育科学出版社2001年6月第1版。
3.   王孝铃著,教育统计学,华东师范大学出版社,2001年7月第1版。
4.   [美]Robert L.Linn & Norman E.Gronlund著,国家基础教育课程改革“促进教
师发展与学生成长的评价研究”项目组译,教学中的测验与评价,中国轻工业出版社2003年1月第1版。
5.   [美]W.James Popham著,国家基础教育课程改革“促进教师发展与学生成长的评
价研究”项目组译,促进教学的课堂评价,中国轻工业出版社2003年1月第1版。
6.   [美]Ellen Weber著,国家基础教育课程改革“促进教师发展与学生成长的评价
研究”项目组译,有效的学生评价,中国轻工业出版社2003年1月第1版。