![]() ![]() |
课程政策的监测与评估研究:基于系统实施忠实度的视角
本书的主要内容是:其一,全面梳理我国课程政策监测与评估面临的挑战;其二,系统分析了实施忠实度的发展脉络;其三,建立了系统实施忠实度视角下的课程政策监测与评估框架和指标体系;其四,以义务教育课程方案、科学和道德与法治两门学科为例,揭示了我国课程政策的实施状况。
该成果运用理论分析和量化研究相结合的方法,从系统实施忠实度视角深入探究了我国课程政策实施的状况。其重要意义体现在以下三个方面:其一,建立了系统实施忠实度视角下的课程政策监测框架,为后续课程政策监测的理论和实践研究提供了重要的知识基础;其二,揭示了我国义务教育阶段课程政策实施的现实状况,为后续课程改革深化推进提供了重要的实证依据;其三,为义务教育课程政策的深化实施提出了针对性建议。
课程政策以课程方案、课程标准和教材为核心载体,是国家教育意志的表征。然而,在传统的课程政策研究中存在着重视课程政策结果(主要是学业成绩),忽视课程方案、课程标准以及教材实施过程的问题,尤其缺乏揭示课程方案实施过程忠实度的实证依据。本书从系统实施忠实度的视角建立课程政策实施分析框架,并且以作为课程标准和教材母体的课程方案的实施状况为例展开相应的实证研究。研究揭示了当前义务教育课程实施过程的现状,并依据现状有针对性地提出了义务教育课程方案落地实施的相关建议,对于未来课程方案的修订和编制提供了一定的证据支持。
第二章 课程政策监测与评估的内涵、现状与挑战
一、课程政策监测与评估研究的内涵
课程政策是国家育人目标的重要载体,为课程改革理论和实践研究指明了方向。但是,如何确保课程政策落实的效果,如何根据课程政策实施过程不断完善课程效能等问题及需要进行深入研究,也就是说如何更好发挥课程政策育人功能是当前急需解决的问题。然而,要实现这些目标,必要涉及到对课程政策的监测与评估研究,因此,开展课程政策的监测与评估研究也成为了当务之急。
(一)开展课程政策监测与评估研究的意义
1.从监测入手深化和落实“公平而有质量的教育”思想
十九大报告中提出“努力让每个孩子都能享有公平而有质量的教育”的重要政策目标,然而,政策目标从中央到地方往往经历一个政策细化或再规划的过程,从政策的制定到不同层面政策主体的执行,期间存在着很多的操作技术和内容需要细化,这种细化的操作在政策执行过程中具有情境性和个体差异性,这些差异性导致了国家关于“教育公平”“教育质量”等政策思想无法落到实处。故而,本研究聚焦于课程政策的监测与评估。一方面,可以从课程层面减少课程与教学方面的差异,促进表现不良的行政主体及时改进,实现课程与教学方面的公平与均衡;另一方面,一般而言,课程政策执行得越好,越有利于实现好的教育,课程政策监测与评估研究成果能够总结现有课程政策执行好的学校或者地区的经验,并将其辐射至课程政策执行较为弱势的学校或地区。
2.为解决当前课程政策流于形式的状况,推动基于证据的课程问责
课程政策落实不到位是我国教育急需解决的一个重要问题,比如国家课程方案非常清楚地规定每周有体育、艺术课的课时,但有些学校随意“缩水”课时或取消这些高考不考的科目,等等。教育结果(如分数)总是要被人比较的,由于“缺乏课程政策的数据”,结果导致部分地方或学校选择“不择手段抓分数”,以致区域教育生态严重失衡、教育竞争极不公平等。这些问题的根源之一就是缺乏大规模、可比较、专业权威的课程政策监测与评估数据。结果导致,只有看得见的结果分数,没有关注政策执行的过程证据,教育问责无法开展。因此,本研究希望通过课程政策监测理论与技术的研究,建立课程政策过程的监测与评估数据库,为破解长期存在的教育“顽症”、推动课程问责做出贡献。
3.解决课程政策与课程实践“两张皮”现象,促进我国课程改革深化推进
在我国课程政策的实践中,课程政策与课程实践之间的“两张皮”现象一直是困扰中国新课程改革纵深推进的顽疾。课程政策在执行过程中出现了表面化、虚假化、失真化等异化现象。通过对课程政策的监测与评估,一方面检视课程政策中所蕴涵的新的课程理念、课程文化、课程行动方式是否得以落实与内化;另一方面监测与评估课程政策与课程实践的切合度。课程政策的监测与评估为课程实践提供了教学改善与学习改进的指导性意见,提高课程政策的现实操作性,从而使课程政策对课程实践的影响由表层走向了深度变革。
(二)课程政策监测与评估的概念
关于课程政策,不同的学者有着不同的理解,但是主要存在以下几种:其一,有学者从课来源上将课程政策作为教育政策的一个下位概念,并且其是依据国家教育目标制定的涉及课程性质及其对课程要素影响的政策,比如,黄忠敬认为课程政策是教育政策的具体化,它集中地反映并支持着教育政策,并且在他看来,课程政策是在国家总的教育目的的指导下制定的,它规定着课程的性质,关系到课程的决策,制约着课程的设计与实施,对整个课程改革具有重要的影响,是整个教育改革的“芯”。 其二,有学者从本质出发,将课程政策规定为是为了调整课程权力而制定的行动纲领和准则。比如,胡东芳指出:“课程政策定义为国家教育行政主管部门在一定社会秩序和教育范围内,为了调整课程权力的不同需要、调控课程运行的目标和方式而制定的行动纲领和准则。 课程政策是一个相对比较上位的概念,但是它却有着具体的、制度化的特定载体。 这些载体虽然涉及面很广,但主要是指课程计划(教学计划)、课程标准 (教学大纲)以及教科书, 它们是承载课程政策信息的有形文件,换言之,课程政策的主要精神和实施手段是通过它们来得以传达和实现的。”塞勒等人指出:“课程政策是教育行政当局针对目前社会需求、学生愿望及未来发展的趋势,依据国家教育宗旨与法令规章,确定课程计划,规划教学内容,调整课程结构,经由法定程序公布实施,成为行政部门或教育机构执行的准则。” 也有学者认为:“课程政策作为政府的一项政治措施, 在课程理念、课程目标、课程结构、课程内容、课程实施、课程评价、课程管理等方面提出了诸多理念、目标与行动策略,为课程实践的发展提供了重要的政策依据与行动纲领。 其三,从呈现形式上,有将课程政策理解为是教学内容和课程开发指南的书面文本。比如,沃克尔认为:“课程政策通常是有关应当教什么以及作为课程开发指南的一个书面陈述” ;薛家宝指出:“课程政策所强调的问题涉及毕业要求,必修课程以及某一领域知识的大概框架。”
根据上述分析可知,研究者们在来源、本质和形式上对课程政策的内涵作了全面的分析,结合不同学者的理解,本研究认为,课程政策是教育政策的一个具体化概念,其是以书面形式呈现、为调整课程权力而制定的行动纲领和准则。课程政策在教育实际中有着很多的表征形式,比如,包含课程准则的教育政策、专门的课程政策等;但是课程政策的核心表征形式主要是三种:国家课程方案、课程标准和教材。
监测与评估(Monitoring & Evaluation)是一项有力的公共管理工具,被认为是能够用于促进政府和组织达成目标。 监测(monitoring)是一个收集和分析信息的日常任务,以便通过这些信息揭示项目过程是如何进行的以及项目过程中哪些方面需要修正。也就是说,监测是一项持续性的工作,其利用系统收集到的信息帮助管理者和利益相关者保持对项目的进展情况、资金分配情况以及项目目标的达成情况。 并且当项目过程中出现状况的时候,可以通过监测信息及时给项目管理者提供反馈,进而做出一些策略上的调整,确保项目能够按照目标实施。一般而言,监测主要回答这六个方面的问题:
? 项目或政策是否按照计划实施和执行?
? 项目与对象之间是否一致?
? 项目规划的结果是否能够有效完成?
? 现实的结果是否与项目最终结果相关?
? 在项目实施过程中会受到哪些因素的影响?
? 面对项目执行过程中的变化,需要有哪些决策方面的调整?
上述六个问题包含了监测中需要注意的关键事项,解决这些问题能够让管理者及时了解项目的实施状况,并且根据实施状况对政策做出调整或者是提供一些保障措施,以便项目能够顺利进行。当然,理解这些关键问题除了能够促进项目顺利进行之外,还能够确保项目制定者和项目实施者之间进行有效对话,明确各自的责任以及相互之间的联系,进而提高项目实施的质量。
评估(evaluation)是对正在进行或者已经完成的任务、项目或者政策以及其设计、实施和结果开展的系统和客观的分析。进行评估的目的是确定项目所带来的预期效果以及这些效果是如何产生的,理解项目在效率、影响和可持续性上如何等。评估应该提供一些可靠的和有用的信息,以便总结经验和教训,为管理决策提供服务。 评估需要的回答的问题主要是这四个:
? 产生项目结果的原因是什么?
? 项目实施对研究对象的影响是什么?这种影响是如何产生的?
? 如何才能够评估项目的实施结果?
? 项目实施过程中,可获得哪些经验和教训?
由上述分析来看,其实监测和评估是存在一定的区别的,即监测主要关注的是项目实施进展状况如何以及进展到了哪一个阶段,这是一种状态性的描述;评估更加关注的是项目的预期目标实现程度及其是如何实现的,其更倾向于是探究因果关系。正因为如此,有学者专门从活动和数据信息来源、绩效评估的基础和分析、管理层的行动要求等三个方面对其展开了分析 :
由上表可知,从活动和数据信息来源看,监测更加侧重于是对过程性数据的收集和分析,评估则关注从多种角度收集。然而,除了上述我们都知道监测与评估之间的区别之外,其实他们之间还存在着千丝万缕的联系,即监测与评估是两个关于衡量政策进程的主要步骤,在一个完整的项目中这两个步骤一般都是协同发生的。监测作为一个聚焦于过程的描述,其对评估结果起着支持作用,高质量的监测是评价的重要信息来源;同时,评价总结了项目的经验和教训,其对监测和指标体系及其研究方法的改进起着重要的促进作用。总之,监测和评价是一个大的项目评价的两个重要过程,共同支撑着广义的评价活动的实现,只是侧重点不同而已。
结合上述分析,课程政策的监测与评估是对课程行动纲领和准则的信息进行日常收集和分析,并且对课程行动纲领和准则的设计、实施和结果进行的系统客观分析。在课程政策研究中,我国学者对课程政策载体进行了相应的归类,即课程政策主要是通过课程方案、课程标准和教科书为载体来进行呈现的。 据此,课程政策的监测与评估研究应该聚焦于课程方案、课程标准和教科书的监测与评估研究。
二、课程政策监测与评估的现状
有上述分析可知,对课程政策开展监测与评估研究非常必要。然而,为了更好地开展本领域的研究,需要了解当前课程政策监测与评估研究的主流趋势以及当前课程政策监测与评估研究的主要方法有哪些,并且针对已有的研究,我们可以为后续研究提供方向上的引导。
(一)课程政策监测与评估的趋势
1.课程政策监测与评估研究已经成为一种国际潮流,但是政策主体单一。
官方正式颁布的课程政策(如课程方案、课程标准、教材等)代表国家基础教育课程的重大文件,其均是以书面形式存在的。那么这些官方的课程政策有没有落实,落实程度怎么样等问题是教育领域中非常值得关注的问题。于是,世界各国在世纪之交的课程改革中,都特别强调课程政策执行这一问题,通过各种路径来加强实施环节的质量,如开发学习指南(美国)、校本课程开发(英国、澳大利亚)、赋权增能计划(日本、韩国)等。不仅如此,世界各国还形成了各具特色的课程政策监测模型,比如,Concerns based adoption model和Surveys of enacted curriculum等。通过下面的一些科研数据,我们能够更加直观地看到课程政策监测与评估的相关研究已经成为一种世界潮流。比如,通过教育研究资料库(ERIC)的搜索发现,截至2018年2月教育学相关的文献为1,147,383篇,课程与教学研究相关的文章为923,020篇,其占教育类文献的总量的80.45%,课程监测与评价的文献为610,389篇,占课程与教学类文献的66.12%,占教育学类文献总量的53.20%。国外关于课程政策监测与评估的理论和实践模型多种多样,比如,霍尔(G. Hall)和霍德(S. Hord)在富勒(F. Fuller)研究的基础上,提出的关注为本采纳模式(Concerns-Based Adoption Model,CBAM); 革新面貌模型(Innovation Profiles,IP); 实施课程的调查项目(Surveys of Enacted Curriculum,SEC); 韦伯课程一致性模型以及成就(Achieve)分析模式。 通过分析发现,上述课程政策监测与评估模型都是要么仅仅聚焦于教师、要么仅仅聚焦于学生,即这些框架聚焦于教师或者学生等某一层面的政策主体,无法揭示课程政策制定和执行过程的复杂性。
2.引进和建构课程政策监测与评估模型并存,但是缺乏整合。
通过文献分析,国内关于课程政策监测与评估的理论和思想表现为引进与建构并存的局面。其一,课程政策监测与评估理论和思想的引进。课程政策监测与评估理论和思想的引进主要表现为:靳玉乐和尹弘飚于2003年引进CBAM理论,后来刘建军对CBAM 的关注阶段理论进行了运用; 刘晶晶利用 SEC 研究了小学语文阅读能力标准与学生评价的一致性;刘学智在其博士论文中分别对韦伯的一致性模式和成就分析模式进行介绍; 姜荣华对SoC 问卷进行了修订。 随着研究的深入,上述这些模式分别被不同的研究者应用于课程政策的监测与评估中。其二,课程政策监测与评估理论和思想的自主建构。自主建构课程政策监测评估理论的研究者主要有:夏雪梅博士建构的评估教师课程实施程度的 L-CERB 架构,邵朝友博士开发的包括教师的课程知识、教师运作的课程、学生参与的课程、学生学业成就的四维度测量框架, 史丽晶博士等从《基础教育课程改革纲要(试行)》中的目标出发概括出了课程政策监测的12个关键点。 虽然研究者们在不断引进和建构课程政策监测框架,但是仍然存在政策主体单一的不足,并且没有形成关于课程政策监测与评估框架上的共识。因此,建构符合中国国情的课程政策监测与评估的整合性框架是一种必然趋势。
3.我国基础教育课程政策监测与评估实践流于形式,急需增强针对性。
虽然近年来随着国际课程政策监测与评估思潮的影响,国内课程政策监测与评估研究开始发展,但是课程政策的监测与评估还处于:没有法规强制规定,也没有奖惩的激励,课程政策的监测与评估基本上流于形式;课程政策的监测与评价人员的知识、技能和身份等没有统一标准,导致难以发现课程政策执行中的问题并提出建设性意见;大部分信息通过搜集各种公开的文献资料、访谈政策过程的当事人和相关利益者、观察课程过程等获得,缺少监测与评估实施细则,过程比较随机与随意,因而对课程政策执行过程中的复杂问题则很少能够监测到。正因如此,这就要求基于现实问题开展课程政策监测和评估实践。
(二)课程政策监测与评估的四种方法
课程政策监测与评估研究对研究方法的依赖性比较强。然而,由于课程研究者们的课程观各有不同,导致他们提出了不同的课程政策实施理论,并且有研究者根据相关理论开发出了相应的课程政策监测与评估方法,但是由于各种评估方法的理论建构不同,具体的评估内容也存在很大差异,导致这些课程政策监测与评估之间不具有可比性。但是要了解各地区之间的课程政策差异,有必要开发出信效度高、适应性强的课程政策监测与评估工具,而新的工具的开发是要建立在借鉴现有的课程政策的监测与评估方法和理论基础之上的。鉴于此,这里主要挑选国外四种评估和监测课程政策实施的方法为分析对象,分别从理论基础、现实基础、数据收集方法以及计分方法等四个方面对上述课程政策实施的监测与评估方法进行仔细分析,以期为有关课程政策实施的评估提供参考,进而为开发具有广泛适应性、高信效度的课程政策的监测与评估工具提供方向上的引导。
国际关于课程政策监测与评估的理论研究有很多,如克服-阻碍-变革模式,组织-开发模式,基于关注的采用模型和系统模型等。 然而,通过对筛选的文献进行分析发现,国外SSCI文献中关于评估课程政策监测与评估的方法主要有四种:课堂观察清单、直接教学观察系统、基于关注的采用模型以及罗根课程实施评估方法。
1.课堂观察清单**
在现实中一个重要却被忽视的问题,即在课程方案评估中,现实课程规划者的意图在多大程度上实现了?对于此,有研究总结道,即使有人对这一问题进行了研究,但是也均以失败告终,因为这些研究者没有采用适当的方法来进行课程实施的评估研究。基于此,埃文斯(Evans)和贝尔曼(Behrman)在总结之前的课程实施评估研究时更详细地指出,实验研究一般会有实验组和对照组,并且实验组是施加干预条件的,然而,对教育而言,教育不应该存在实验组和对照组, 即如埃文斯(Evans)和谢弗勒(Sheffler)所建议的那样,课堂不存在实验组。 如果还是运用典型的实验方法来研究教育问题,就会忽视教育的复杂性和生态性。鉴于此,埃文斯和贝尔曼开发出了一种通过课堂观察清单的方式来收集课程实施数据。
在埃文斯和贝尔曼看来,课程实施的目的是激发学生的自主学习,而要实现这一目标就需要通过这些途径:学生自主选择学习材料,学生自我管理评价手段,学生自我诊断等。更确切地说,在每一个学习单元,他们期望学生做到如下八点:①检查自己的学习进展表格和选择适当的前测;②自我管理前测;③自我评分前测;④根据前测中表现不好的项目选择教学任务;⑤基于兴趣选择教学任务;⑥自我管理后测;⑦自我计分后测;⑧基于后测计分决定是否需要附加教学任务。课堂观察清单可以以这八个点为基础来编制,即它可以通过添加短语构造观察表。与此同时,还需要有一个观察员来判断关于项目的实施情况,当然,如果清单太长的话,就需要几个观察员。这种评估方法认为,一个是或否的评估方法足够用来描述课程实施,即项目被观察到了就计1分,没有被观察到就计0分。当然,如果要进一步分析课程实施的状况,根据行为的性质,观察者可以计算相关的频率和发生比率。
2.直接教学观察系统
格尔斯滕(Gersten)和艾伦(Allen)等人开发了以直接教学督导编码(Direct Instruction Supervision Code)为基础的直接教学观察系统(Direct Instruction observation system)。 这种课程实施评估方法的产生主要是基于两点原因:其一,直接教学模式会详细地描述教师应该说什么和应该做什么,每天在阅读、算术和口语上应该花多少时间,课堂教学的步调应该是什么样子,学生的回答应该保持什么样的准确度等。因此,斯特宾斯(Stebbins)在课堂研究的分类中指出,直接教学模式是一种更加直接和简单的操作行为编码系统。 其二,由于传统教育实践评估者认为课堂观察是理想的评估方法,尽管有些研究者使用访谈技术来评估教育实践的水平,但是,传统的教育评估研究者们认为,访谈技术只能提供有用的补充信息,而不能提供全面的信息,并且访谈还可能会偏离主题。 因此,直接教学观察系统的产生是有着重要的现实基础的。
除上述现实基础之外,直接教学观察系统还有着自己的理论基础。该理论最原始的来源是直接教学模型。如上所述,该模型详细地描述了教师应该说什么和应该做什么,每天的阅读、算术和口语中应该花多少时间,课堂教学的步骤应该是怎么样的,学生的回答应该保持什么样的准确度等。基于此,格尔斯滕、科米尼(Carnine)和威廉姆斯(Williams)开发了记录六种行为的百分比和一种时间分配的观察结果的观察指标,他们分别是:形式准确度(Format accuracy),信号的使用(Use of signals),修正(Corrections),步骤(Pacing),学生准确度(Student accuracy)和强化(Reinforcement)和学术时间的分配(Allocated academic time)。通过对这七个指标的观察,可以记录教师和学生的课堂表现出现的百分比和频率。
3.基于关注的采用模型
美国在20世纪60年代进行了引人注目的教育变革,然而,教育变革并没有实现预期目标。而对于课程变革失败的原因,很多研究者认为这是课程实施过程中过于重视课程采用而忽视课程实施过程造成的。鉴于此,霍尔等人专门开发了基于关注的采用模型以评估课程实施过程。文献分析发现,霍德(Hord)和赫林-奥斯汀(Huling-Austin)就以基于关注的采用模型为基础分析了教师课程实施的水平; 该模型是霍尔(Hall)等人基于富勒(Fuller)的教师职业关心四阶段理论而提出来的,它由三个诊断维度组成:关注阶段(Stages of Concern, SoC)、应用水平(Level of Use, LoU)和革新构造(Innovation Configuration, IC)。 第一部分:关注发展阶段。关注发展阶段主要包括七个阶段:意识、信息、个人化、操作、结果、合作和聚焦等。第二部分:应用水平。应用水平是为了处理课程实施变革前的培训和材料的问题。它主要有八个阶段,分别从“不实施”到“更新”,每一个阶段有意识、信息、个人化、操作、结果、合作和聚焦等七个类别。第三部分:革新构造。革新构造的假设是“几乎在所有的情况下,不同的教师操作的革新都会沿着一个连续体发生变化”。一端代表实施的理想结果,另一端代表糟糕的结果。
评估课程实施成功的公式是:IS=f(LoU, IC, SoC)。 上述三个维度的测量均采用各自不同的一套工具。关注阶段是通过问卷调查实现的,问卷由35个项目组成,采用李克特8点计分量表进行测量。第二个维度是应用水平,该维度是通过访谈和观察实现的,对每位教师的访谈时间为15-30分钟,访谈提纲的基本设计与关注阶段量表相一致。第三个维度是革新构造,这主要是通过观察实现的,观察的内容主要涉及描述革新的各种实施行为。也有研究者通过对革新构造维度进行修改,整理出了测量课程实施的革新构造图,该图是经过精心设计而开发出来的以生动的文字图片来描述实施革新和变化的方法。
4.罗根课程实施政策监测与评估方法
罗根课程实施评估方法的产生是基于全球课程研究重视“课程采用”、忽视“课程实施过程”的现象,以及南非课程变革的现实需要。这种评估方法的理论基础是罗根课程实施理论模型,该模型包括三个维度:实施简况(Profile of Implementation)、革新能力(Capacity to Innovate)和外部支持(Outside Support),每一个维度下面包括若干个子结构(Sub-structure)。 三维度的具体结构如下:实施简况是用以帮助理解、分析和表述一个课程理想被付诸实践的范围。实施简况的子结构有:课堂互动的性质(老师做什么,学生做什么);科学实践工作的使用和性质;社会中的科学以及评估实践等。支持革新的能力尝试着理解和阐述那些能够支持或阻碍新课程实施思想和实践行为的校本因素。支持革新能力可分为四组子结构:物理资源、教师因素、学生因素和学校风气与管理。外部支持旨在描述一个学校外部组织承担的试图影响学校实践的各种行为。外部支持的子结构是这样分布的(详见表1):前三列分属于支持学校的两种形式:物质的和非物质的。物质支持分为两类:(1)提供物理资源如建筑、书籍或设备;(2)对学生的直接支持,其中可能包括诸如学校午餐计划、学校安全和课外学习的安静场所。非物质支持最常见的提供形式是专业发展。表2-2的第四列表达了一个组织选择使用杠杆作用的原理来引导变革的能力。第五列描述的是外部监督而不是内部监督的程度。
评估课程实施的成功主要是通过对上述三个维度及其子结构的水平等级的分析实现的。下面以实施简况中的课堂互动子结构为例来介绍该种评估方法。 为了评估课堂互动的水平,研究者将课程互动分为四级水平,并且每一级水平均主要关注学生和教师在课堂中的行为和活动。在第一级水平上,教师的表现是:有组织、正确而有序的方式呈现内容;基于精心设计的上课计划等。学生的表现是:保持专注和投入;回答并提出质疑。如果某一课程实施中的课程互动符合上述教师和学生的行为和活动表现,那么该课程的课堂互动水平就计为“一级”。当然,如果课程实施过程中课堂互动符合“二级”、 “三级”或者“四级”中的教师和学生的行为表现,那么记为相应的等级。由此可见,这种评估方式在本质上是以等级积分的计分方式来评估课程实施过程的。
你还可能感兴趣
我要评论
|