搜索
您的当前位置:首页正文

中小学校考试数据分析的现状调查与思考——以福州市某县级重点中学为例

来源:爱够旅游网
中小学校考试数据分析的现状调查与思考 ——以福州市某县级重点中学为例 原霞赵俊南 【摘要】考试是评价的一种手段,考试数据蕴含丰富的教与学信息。本文通过对福州市某县级重点中学考试数据分 析的现状调查,发现中小学校中的考试较为频繁,考试形式比较单一;考试分数仍是评价教师和学生的首要指标;考 试数据分析不够全面,试卷本身的信息分析及其教育功能开发得不到应有的重视,影响着对教师和学生的科学评价。 要想充分挖掘和利用考试数据背后所蕴含的丰富信息,需要教师具备相关的6,-/ ̄和技能,能够从教育统计学、教育测 量与评价学及教育学等多方面对数据进行分析,从而为教师的教学和学生的个性化发展提供更多的参考和建议。 【关键词】考试数据分析;现状调查;思考 【中图分类号】G622.474 【文献标识码】A 【文章编号】1 674—1 536(201 0)07—0054—05 近年来,随着新课改的不断推进,以高考、中考 1.考试较为频繁,考试形式比较单一 本研究对该校初二年级学生2009~2010学年 第一学期参加的不同形式的考试次数进行了统计。 表1 该校初二年级学生2009—2010学年第一学期参加的考试次数统计 为代表的中小学考试改革逐渐成为人们关注的重 点。要实现考试质的飞跃,除了考试内容和形式的 转变之外,还需要对考试数据进行全面详细的分析。 对此,教育部考试中心戴家干主任提出:“要改造传 统的‘一张纸条上写几个数字’式的分数报告单,充 分挖掘和利用考试数据背后所蕴含的丰富信息,向 考生提供一个能够反映其知识、能力、特长、性向和 潜质的全面而详实的评价报告。”中小学校考试结 表2该校初二年级学生2009—201 0学年第一学期 参加的不同形式的考试次数统计 考试分类和形式 纸笔考试 校内(本校 教师出题) 17 校外(多校联考 或市统一出题) l3 总计 30 束后,教师通常会分析哪些数据?这些分析方法存 在哪些不足?考试数据实际上蕴含了哪些信息?教 师应该如何分析和利用这些信息,才能达到改善教 学和促进学生个性发展的目的?这正是本文所要探 讨的问题。 一、其他形式的考试 总计 12 29 0 l3 l2 42 从表1、表2我们可以看出,虽然只统计了某门 主干课程的考试,而且可以称之为广义的考试,但考 试这一评价手段的采用在初中阶段还是比较频繁 的。访谈中我们了解到,只要是与考试有关,小到随 堂考,大到期末考,参考师生基本上都会表现出不同 程度的焦虑。对于学生来说,某一次考试结束后,教 师、家长都会不自觉地在一定范围内给自己排名,频 某中学考试现状的调查及原因分析 本研究主要采用问卷调查法、访谈法和文献法, 以福州市某县级重点中学初中部师生为研究对象, 按照随机抽样方法,共调查107人,其中教师45人、 学生62人,问卷回收率为100%。另外,我们收集了 该校初一、初二年级学生2009~2010学年第一学期 各班的月考统计表、年段总分统计表、不同学科的质 量分析表以及2008—2009学年第二学期期末考试 成绩统计表(因为调查时2009~2010学年第一学期 期末考试还未进行),数据具有一定的说服力。 (一)存在的问题及不良影响 繁的考试使得学生经常处于紧张状态,有的学生甚至 做梦都会梦见自己没考好;对于教师来说,只要某次 考试的覆盖范围超出了一个班,领导都会过问,而且 学生的考试结果不可避免地要与平行班、平行校进行 比较,给自己的日常教学造成了不小的压力。此外,调 查中我们也发现,该校的大部分考试都是采用纸笔做 答的形式,频繁的考试使得教师连批改试卷都觉得麻 本文为福建省教育厅社会科学研究项目(JBS09054)阶段性研究成果。 原霞,福建师范大学教育学院教师,主要从事教育基本理论和考试评价研究。(福州赵俊南,福建省永泰县第三中学教师。 350007) 田 2010年7月 烦,更不用说进行考试数据的整理分析了。 2.卷面总分仍是衡量学生和教师是否优秀的 表5该校初二年级部分学生的2008—2009学年第二学期 期末考试各科及总成绩统计 与 评 价 姓名 总分 语文 数学 英语 物理 首要指标 鄢x x 255 89 78 88 73 在随后进行的关于“什么是衡量教师和学生是 汪×× 251 80 86 85 90 否优秀的标准”的调查中,该校大部分师生都选择了 鄢x x 248 78 84 86 60 鄢x x 224 87 88 49 83 “考试分数”这一选项。 蔡x× 211 74 91 46 46 表3关于“优秀学生”的评价标准比例统计表 张x x 170 84 39 47 38 \\ 指标 用的考试数据基本上可以分为两大部分:一部分数 \ 考试分数 思想品德 态度情感 学习能力 其他 评价者\ 据统计只与学生的具体分数有关,包括最高分、最低 \ 学生 45% 5% 10% 2O% 2O% 分、单科得分、总分;一部分是根据学生卷面分数高 教师 60% 1O% 6% 20% 4% 低和参考人数多少计算出的统计量,比如优秀率、合 表4关于“优秀教师”的评价标准比例统计表 格率、平均分,等等。 \\ 指标 我们不难发现,上述统计存在以下问题。 评价者\ \\ 学生考试 师德和 教师的 分数 工作态度 处世 科研 能力 其他 首先,统计数据仅限于学生考完后的卷面成绩, 至于体现试卷质量的一些常见指标,比如信度、效 学生 45% 35% 4% 1O% 6% 度、区分度、难度等没有进行统计。访谈中我们了解 教师 35% 15% l2% 35% 3% 到,大部分教师对这些统计指标并不十分了解,他们 由表3、表4可见:在校期间,教师和学生最关 中的大部分人听说过这些指标,但这些指标具体有 注的依然是学生的考试分数,卷面总分仍是衡量教 什么用途、该如何计算,等等,他们并不清楚。每次 师和学生是否优秀的首要指标。访谈中我们了解到, 考试结束后,这些指标只是拿在教研会上讨论一下, 虽然有些人在调查问卷中也选择了其他指标,但他 常常是某位教师凭个人感觉谈一谈自己的看法,基 们只是觉得理论上应该这样。由于人的品德、情感、 本不会进行实证研究。实际上,缺少试卷质量分析 态度等指标很难直接量化,一旦回到实际操作层面, 的考试好比是用某种工具测量物体,我们只关注了 分数仍然成为了衡量学生和教师的主要指标,师生 测量结果,至于测量工具本身是否有问题则并不清 丰富多彩的教学活动往往在现实中被抽象成了一个 楚。考试特别是应用范围较大的考试,如果不对试 死板的分数,这不仅窄化了素质教育,而且在一定程 卷本身的质量加以分析,就很容易偏离教学内容,这 度上进一步强化了“应试教育”。 不仅严重违背了教育测量学的基本原理,而且也会 3.考试数据的分析不够全面,试卷本身的信息 给教师和学生一种错误的导向,使考试成为“应试教 分析及其教育功能开发得不到应有的重视 育”的推手。日常教学中,很多教师为了能更好地鞭 一般来说,每一次考试结束后,学校都会要求教 策学生,往往故意加大考试难度,出一些偏题、怪题, 师对考试数据进行分析,这些数据主要包括学生的 让学生考低分,这其实是有违考试的科学性的。 单科成绩和总分,然后再根据学生得分的高低以及 其次,对学生的排名依然是以考试总成绩为基 参考人数的多少统计出其他指标。表5和表6即为 准,且总成绩的计入是有选择性的。比如该调查所 该校初二学生的期末及月考成绩统计表。 在地的中考科目不包括物理,因此学生的物理成绩 由表6我们可以看出,考试结束后,该校教师常 在平时的考试中没有纳入总分,从知识结构上说,这 表6该校初二年级学生的200g~2010学年第一学期数学月考情况统计表 应考 参考 及格 及 亚 优良 优 优秀 优 最 最 班级 人数 人数 人数 格 室 均 人数 良 人数 秀 室 室 高 分 低 分 1oo 99—90 89—8O 79—70 69—6o 59—5O 49—40 39—3O 29—20 19—10 9—0 I 60 56 21 35.0% 47.6 19 31.7% 13 2I.7% 98 6 O 5 8 6 2 8 4 10 4 4 5  I4 57 55 25 43.9% 48.5 19 333% 1O 17.5% 95 4 0 3 7 9 6 2 6 7 4 10 1 f小计 1l7 111 46 39-3% 48.0 38 32.5% 23 19.7% 98 4 O 8 15 15 8 10 10 17 8 14 6 2010年7月 田 然是不合理的。另外,用学生考试的原始得分来 际工作中大显身手。 二、考试数据蕴含的信息及相关分析 算总分并不合理。比如,表5中某同学的语文课 程得分为84分,分数并不低,但由于他的英语、数学 成绩太低,所以在排名上比较靠后。但实际上,他的 语文课程表现在全班同学中可以说是比较优秀的, 语文教师可以抓住这一特点,有针对性地挖掘他的 试卷及其分数是学生知识结构和思路的轨迹见 证,是学生学习个性的集中表现,同时也是教师教学 水平和教学策略的有效反映。考试数据蕴含着丰富 语文学习潜能。由此观之,如果我们不进行认真分 析,学生的试卷信息就无法得到全面具体的体现。 再次,平均分、及格率、优秀率等常见的统计指 的教与学信息,我们如果能够分析和反思数据背后 的这些信息,对于改进教师的教学和学生的学习无 疑有着重要的指导意义。笔者认为,考试数据的整 标其实只反映了一部分考试信息,如果我们仅仅依 据这些指标就对教师的教学水平进行评价,实在有 违公平。 (二)原因分析 1.一元评价理念下的思维定式 虽然我国正在积极探索和实践多元的教育评价 体系,也推出了许多新的评价方法和技术。但由于 我国的高考、中考仍以考生的分数为主要录取依据, 其巨大的惯性使得中小学校、家长和教师往往只重 视学生的学习结果,不重视分析每个学生的试卷信 息;只重视考试结果量化的分数表达,不重视对学生 学习特点、发展进步以及潜能结构的个性化分析。 在这样的评价理念下,师生丰富多彩的教与学过程 被抽象为一个死板的考试分数,而这个分数又成为 了评价教师和学生的唯一标准。在我国很多地方, 这种奖惩性的、终结性的一元评价理念早已深植于 教师、家长和学生心中。在这种单调和抽象的评价 思维下,考试数据的分析必然丢失了教师和学生在 学习和教学过程中显示出的大量有用信息。 2.教师和管理人员缺乏相关的知识与技能 对学生进行个性化的评价必须要利用和分析大 量的数据,而利用和分析数据是一项技术性很强的 工作,需要实施者有一定的知识背景和相关的分析 技能,包括考试学、教育统计学、教育测量与评价学 以及教育心理学等相关的知识和技能。调查中我们 发现,该校绝大部分教师都是直接从师范类院校毕 业的,他们在教育教学方面的基础仍是老三门,而且 教育过程中普遍是重学科知识、偏教育类知识。知 识结构的不完整、教育测量与评价技能的缺乏,使得 绝大多数教师不理解基本的评价理念、原则和方法, 无法熟练运用基本的统计技能。有的教师即使有了 一些好的想法,但由于知识结构的限制也无法在实 宙 2010年7月 理和分析可以从以下几个方面着手。 (一)考试数据的统计学分析 1.常见统计指标 从统计学角度看,当样本足够大、考试过程足够 规范,学生的考试成绩应该呈现出正态分布或近似 正态分布,且分布的位置和形态应该与其平均分和 标准差等息息相关。所以,考试结束后,学校和教师 统计出及格率、优秀率等指标,这本身是无可厚非的, 但在统计出这些指标后,我们还要解决这些指标如何 应用的问题。也就是说,这些统计指标伴随着不同的 考试、不同的群体和不同的学校有着不同的含义,如 果我们不考虑各种实际差异,仅仅用这些指标来硬性 衡量教师的教学水平实在有违公平和公正。 在教育统计学中,我们要想正确地反映教师的 教学水平,就需要对所教班级的考试分数进行整体 描述,主要包括三种量化指标:一种是集中量,表明 学生的考试成绩集中在什么水平,我们可以根据考 试数据的特点计算出班级成绩的算术平均数、中数、 众数等;一种是离散量,表明某一团体中学生之间的 差异程度,我们可以根据考试数据的特点计算该团 体得分的标准差、四分位差、相对差异量等;还有一 种是偏态量,如果某一团体的考试成绩分布呈现出 正偏态,说明该团体中大部分人的成绩集中在低分 段,如果某一团体的考试成绩分布呈现出负偏态,说 明该团体中大部分人的成绩集中在高分段。 2.分数的转化 分数转化的主要目的是赋予分数相对的意义。 由于卷面分数都是绝对分数,受测者很难了解该分 数背后的含义,并且不同学科问由于知识结构不同 也很难进行直接比较,特别是用绝对分数相加得到 的总分在很大程度上掩盖了知识结构的不平衡,不 利于学生发现问题。如果我们把绝对分数根据公式 耋丛 塑生 鏊 E圃隧两甚赫撼髓精影潼硐瞄E嘘聊置垦量虱瞄巨葺 胃 学生潜能的发挥和个性的培养。与此同时,因为z 分数本身是一种等距数据,意义明确也可以进行加 有效反思的过程,有利于进一步提高教与学的效率。 3.区分度和难度分析 减,根据z分数计算总分肯定会更加合理。 (二)考试数据的教育测量与评价学分析 考试数据的教育测量与评价学分析不仅可以反 映试卷本身的质量和考试实施的科学化程度,从而 真实地反映出学生的学业水平,而且更容易发现教 师教学中存在的问题,同时可以在教学改进的过程 中提高教师的命题技巧和能力,为下一步的教学和 考试提供经验和借鉴。测量与评价学分析主要包括 试卷的整体分析和试题的项目分析,前者指试卷的 信度和效度,后者指试题的难度和区分度。 1.信度分析 信度是针对考试数据具有多大的可信程度进行 的分析。某一份试卷的信度越高,说明其误差控制 越好,也就是考试的结果越可信,考试分数越能代表 学生个人的真实水平。信度从理论上来说是多次计 算或重复测量分数的相关系数,但这种计算方式在 实际操作中比较费时费力,如果不是出于特殊研究 的需要,我们一般选择计算克龙巴赫 系数。对于 试卷的信度,我们一般要求取值在0.70以上。如果 某一份试卷的信度过低,我们就要考虑该试卷的试 题数量是否合适、考试组织是否科学化、所选试题是 否能诱发学生表现出最好的行为,等等。勿庸置疑, 对试卷的信度分析及其反思既有利于考试组织的科 学化,又有利于提高学生的应试心理素质。 2.效度分析 效度是试卷有效程度的分析,反映的是考试在 多大程度上测评到我们所欲测评的目标。效度是衡 量试卷质量最重要的指标。就中小学校的考试而言, 我们可以分析试卷的内容效度,也可以分析其效标 关联效度。内容效度是请相关教师就试卷内容与教 学目标的相关性进行分析,更多的是定性的标准。 效标关联效度则是计算学生的某次考试成绩与可用 于参照的另一考试成绩的相关,一些终结性测验或 者是规模较大的考试,相对具有权威性和标准性,就 可以选做为效标。试卷的效度一般也要求取值在 区分度和难度是反映单个试题质量的指标。题 目区分度就是题目区别被试水平的能力量度,通常 用高低分组法或者是计算该题目与试卷总分的相关 系数来表示。一般说来,如果采用前一种方法计算, 区分度取值在0.40以上较好;如果采用后一种方法 计算,区分度取值在0.70以上较好。如果某一份试 卷的题目区分度不高,以该试卷为测评工具的考试 就难以发挥其区别选拔的功效,也不利于教师发现 学生的差异,难以进行个性化评价。题目难度是反 映题目难易程度的量度,通常用考生的得分率或通 过率等方法计算。如果某一试卷的题目难度过大, 容易挫伤学生的积极性,难度过小则激发不出学生 的兴趣和上进心。因此,对于常见的常模参照考试, 大多数题目的难度控制在0.50左右比较适当。 (三)考试数据的教育学分析 考试是评价的一种方式和手段,其最终目的是 为评价服务。考试数据的教育学分析就是通过详细 研究学生的试卷,对学生的考试结果进行分类和个 别化评价,使考试具有更多的评价内涵。 1.分类研究与评价 著名的统计与测量学专家克龙巴赫(Cronbach) 曾说过:对发生在一个教室的活动进行研究的难度 至少等同于对飓风的研究。这或许是一种夸张的说 法。当教师在课堂上面对众多学生时,他们会发现 自己很难准确观察和描述每一个个体的行为,教师 的教学行为总会不自觉地迎合多数学生的行为习 惯。但是,教育学理论和实际教育经验告诉我们,如 果不对学生进行分类研究,教师的教学行为将最终 陷入混乱和迷惑。分类研究就是通过具体的试题分 析来研究学生的共性。比如分析相同得分的试卷, 教师可以发现哪些要点和问题学生掌握的比较好, 哪些掌握的还不够,这实际上是在对学生的学习水 平和教师的教学水平进行某一维度的评价。再如对 于学生的选择题,教师可以分析各种错误选项的比 例,发现一定范围内共同存在的学习误区和薄弱之 2010年7月 团 考试与招生● 教 胃 ■田隧困 疆l蘑甄猫镊蹰强l 躔蝈屋薹嗣 悲雪 ∞ 量 试卷如同一面镜子,时时折射出学生的个性。 通过分析与研究不同学生的试卷,我们可以看出学 生的知识、能力、特长、性向和潜质,从而对学生的发 展提出有针对性的建议。比如,通过学生不同学科 的得分,我们可以推导出学生擅长文科还是理科;通 过分析学生的答题思路,我们可以看出学生擅长的 思维方式;通过具体的失分题目分析,我们可以找到 学生可能存在的学习困难和知识缺陷;我们还可以 通过与学生的面谈来验证原先的判断,以便采取必 要的教育补救措施。此外,教师有选择地研究那些 学习困难学生的试卷,并结合平时的观察和测验判 断,可以对学生进行有针对性的学习矫正和引导,这 既是教师的责任,也是最具人文关怀的教育方法。 三、关于加强中小学校考试数据分析的建议 (一)改变分数至上的考试观念,真正发挥考试 的评价内涵 考试数据能够为评价提供丰富的信息。关于评 价,著名测量与评价专家斯塔费尔比姆(Stuflfe— beam)曾说过:“评价最重要的意图不是为了证明, 而是为了改进。”通过考试发现学生的不足,为学生 的下一步发展提供建设性意见是考试的主要目的, 把考试分数当作评价的唯一手段本身就是很大的误 区和浪费。考试不光要考知识,还要考能力。我们不 光要关注学生考试的最终分数,还要关注这些分数 所反映出的学习过程。这其中包括的很多因素,比 如学生的思维方式、态度和兴趣等,是无法直接测量 的。所以,不以选拔为目的的学校日常考试必须与 中考、高考等选拔性考试相区别,这就需要建立起科 学完善的中小学质量保障机制。只有在考试分数不 作为考评学校、教师的唯一指标的情况下,学校、教 师、家长和学生才能真正关注那些分数之外的内容, 才能充分利用考试数据蕴含的丰富信息多方位评价 学生,考试也才能更好地发挥评价和服务的功能。 (二)加大师范教育改革力度,提高教师的评价 素养和技能 如今,社会对教师专业化的要求越来越高。发 达国家在教师教育过程中一贯重视提高教师评价方 田 2010年7月 师教育基本上采用的是“学科型”模式,教育学科知 识仅限于普通教育学和心理学,而凸现教师职业化 的课程过少,这些都使得大部分在职教师除了用考 试总分来评价自己的教学和学生的学习外,不清楚 还可以利用哪些数据,还可以采用哪些方法进行评 价。因此,在我国现阶段,加大师范教育的改革力度 势在必行。师范课程中除了心理学、教育学等基础 课程,还要开设教育测量与评价、心理与教育诊断技 能等专业课程,提高教师评价学生的能力。 (三)切实减轻教学负担,提高考试数据分析的 精确性 对学生做出正确的评价就要对大量的数据进行 整理分析,数据处理的准确性在一定程度上决定了 评价的科学性和公平性。调查中我们发现:一线教 师的工作量非常大,很难有多余的时间和精力对每 一次考试的试卷进行分析。但实际上,高质量的试 卷本身就决定了考试数据的精确性。因此,对于试 卷本身的质量分析,我们不妨尝试效仿国外的办法, 也就是鼓励建立一些民问评价机构,由这些专业机 构和专门人员研究教学内容和考试大纲,针对不同 的学习对象和教学进度编制多份高质量的试卷,供 相关学校有偿使用。另外,除了试卷质量分析,其他 数据的处理也比较繁琐,如果没有配备相应的统计 软件,硬性要求教师手动处理这么多数据无疑将加 重教师的负担,甚至可能会引起教师的抵触情绪。 建议有关部门开发一些科学实用的配套软件。教师 或教务人员在需要进行数据分析时只需输入相关的 信息,经过软件处理后就能得到一份包括多种有效 数据及其分析在内的成绩报告单,这无疑可以为师 生提供更多的考试信息和继续学习的建议。 参考文献: [1]戴家干.高考应坚持统一考试多元评价[N].中国教 育报,2009—09—16. [2]陈旗敏.好教师应当拥有良好的试卷分析能力[J]. 教育与考试,2007(2)。 [3]黄光扬.教育测量与评价[M].上海:华东师范大学 出版社.2002. 责任编辑,王彩霞 

因篇幅问题不能全部显示,请点此查看更多更全内容

Top