美国《婴幼儿学习环境评量表》的代际演变及其启示

2022.07.20

周燕　巩蕴清　黄曼菁　李克建

【摘要】美国《婴幼儿学习环境评量表》（ITERS）是国际范围内应用最为广泛的0～3岁婴幼儿托育机构质量评价工具。该量表从ITERS到ITERS-3，经历了3个版本的发展与演变。借鉴美国《婴幼儿学习环境评量表》的研制经验，我们应当重视实证研究基础与多元化数据采集;站在儿童的立场，重视教育环境与过程对婴幼儿语言、认知发展的支持;精准定位婴幼儿托育机构质量的进阶梯度，兼顾评估与质量提升的引领功能;转变教育质量评估理念，从质量要素的静态评估走向相互作用的动态评估。

【关键词】美国;《婴幼儿学习环境评量表》;托育机构质量;代际演变;启示

【中图分类号】G619? ?【文献标识码】A? ?【文章编号】1004-4604（2021）1/2-0016-06

《婴幼儿学习环境评量表》（ITERS）由美国北卡大学FPG儿童发展研究所研发，是国际范围内应用最为广泛的0～3岁婴幼儿托育机构质量评价工具，主要对托育机构中影响婴幼儿学习的一切外部条件进行观察评价，包括结构性学习环境（如空间与设施、活动室规划、儿童陈列品、活动材料等）和过程性学习环境（如日常照料、师幼互动、课程及教学等）。越来越多的研究表明，早期托育机构质量对儿童短期和长期发展起着至关重要的作用。〔1-3〕在婴幼儿时期获得过高质量托育服务的儿童更有可能在日后获得良好的学业成就。〔4〕近年来，全面二孩政策的实施，促使我国托育事业发展迅猛。研制适宜的评价工具，客观深入地评价婴幼儿托育机构质量，成为提升婴幼儿托育服务质量，促进婴幼儿身心全面健康发展的重要任务。本文对美国《婴幼儿学习环境评量表》的代际演变进行介绍，总结其经验，供相关人员参考。

一、《婴幼儿学习环境评量表》的研制与演变

《婴幼儿学习环境评量表》经历了3个版本的发展与演变，分别是1990年出版的《婴幼儿学习环境评量表》，2006年更新的《婴幼儿学习环境评量表（更新版）》（ITERS-R），以及2017年出版的《婴幼儿学习环境评量表（第三版）》（ITERS-3）。量表采用李克特七点计分法，1分代表“不适宜”，3分代表“合格”，5分代表“良好”，7分代表“优秀”。

从ITERS到ITERS-3，量表的修订完善主要通过以下途径展开。一是借鉴相关研究经验。研发者会查阅儿童早期发展相关研究成果，以及学习环境对儿童发展影响的研究成果，并将历代ITERS量表同其他0～3岁婴幼儿托育机构质量评价工具进行内容比较，将其作为删除、增加量表项目的理论依据。二是积极采纳量表使用者的反馈意见。研发者通过发放线上和线下调查问卷，收集量表使用者的反馈意见，尤其注重收集使用ITERS系列量表超过两年以上的评估员、专家小组的反馈意见，以及ITERS研发者自己的反思，将其作为删除、增加量表项目的现实依据，从而不断提高量表的科学性和适用性。三是进行大样本数据的采集与分析。研发者通过采集大样本数据进行分析，了解量表的得分范围、相对难度及效度，将其作为删除量表项目的实证依据。在量表的信效度验证方面，美国本土的测验结果表明，ITERS量表的重测信度介于0.58至0.89之间，内部一致性α系数为0.83。〔5〕ITERS-R总量表的内部一致性α系数为0.93，其余子量表的内部一致性α系数介于0.47至0.80之间。ITERS-3总量表的内部一致性α系数为0.914，其余子量表的内部一致性α系数介于0.761至0.940之间。结果表明，无论是在子量表层面还是在项目层面，ITERS-R和ITERS-3均具有较高的信效度，可以作为相对独立的量表使用，适用于不同的评估环境。〔6，7〕

另外，研究发现ITERS系列量表具有较好的预测效度，能在一定程度上预测婴幼儿的发展水平。研究表明，ITERS-R的得分对婴幼儿认知发展具有一定预测作用，当ITERS-R的得分高于3.846时，托育机构质量与婴幼儿认知发展呈正相关，而当ITERS-R的得分低于3.846時，托育机构质量与婴幼儿认知发展呈负相关。〔8〕

二、《婴幼儿学习环境评量表》的代际传承

1.儿童立场：关注环境对婴幼儿学习与发展的支持，强调婴幼儿的实际体验

从ITERS到ITERS-3，历代量表的评分等级均是站在儿童的立场上构建的，时刻关注环境对婴幼儿学习与发展的支持，强调婴幼儿的实际体验。从儿童立场出发评估托育机构学习环境是ITERS系列量表研制的核心理念。〔9〕历代研究者在研制《婴幼儿学习环境评量表》时，均代入婴幼儿的视角，将促进婴幼儿发展作为构建量表评分等级的重要依据。研究者们将对婴幼儿身心发展产生负面影响的环境定位为不适宜环境;将健康安全、能够满足婴幼儿基本需求的环境定位为合格环境;将能够为婴幼儿提供适宜发展的环境和活动，能满足大多数婴幼儿发展需求，刺激婴幼儿认知发展，鼓励婴幼儿独立自主活动的环境定位为良好环境;将能够满足婴幼儿个别化发展需求，鼓励婴幼儿创造性发展的环境定位为优秀环境。

2.内容框架：聚焦婴幼儿学习与发展生态系统的构成要素

从ITERS到ITERS-3，历代量表均以布朗芬布伦纳的儿童发展生态系统理论为基础，聚焦婴幼儿学习与发展生态系统的构成要素。儿童发展生态系统理论认为，儿童是嵌入在一个多层级的社会生态环境系统中的，这个系统包括微观系统、中间系统、外系统、宏观系统。儿童与环境要素，尤其是与身边情境要素的互动是推动其学习与发展的重要中介要素。基于此，历代《婴幼儿学习环境评量表》均将婴幼儿所处的物理空间和材料、所参与的活动及所发生互动关系的人，作为量表内容框架的构成要素。〔10〕以ITERS-3为例。该版量表将空间和设施、个人日常保育、语言和图书、活动、互动、课程结构6个维度（33个项目）作为婴幼儿学习与发展生态系统的构成要素。每个项目在四种质量水平上使用李克特七点计分法，每种水平通过描述性定义来说明质量的期待水平。具体而言，“空间和设施”主要指向是否为婴幼儿提供适宜的室内空间、日常照料和学习设施，房间规划是否合理，环境布置是否适宜有效。“个人日常保育”主要指向正餐/点心、换尿片/如厕的时间安排是否合理，卫生情况、护理方式、健康实践、安全实践的性质与状态是否适宜。“语言和图书”主要指向与婴幼儿交谈时，鼓励、回应婴幼儿的交谈以及鼓励婴幼儿使用图书的频率是否适宜。“活动”主要指向美术、音乐和律动、积木、角色游戏、自然/科学、数学/数字、大肌肉运动等活动材料的种类、适宜性、使用情况以及保教人员指导的适宜性。“互动”主要指向指导游戏和学习、同伴交谈、师幼互动、提供身体温暖、指导婴幼儿行为的频率与适宜性。“课程结构”主要指向过渡活动、自由游戏和小组游戏活动的时间安排以及保教人员指导的适宜性。

三、《婴幼儿学习环境评量表》的代际更新

1.更加强调语言、科学学习对婴幼儿认知发展的作用

从ITERS到ITERS-R，美国《婴幼儿学习环境评量表》的研发者通过借鉴各州的学习标准及实证研究结果，发现语言和科学学习在婴幼儿认知发展过程中具有重要价值。为突显语言、科学学习的重要作用，ITERS-R建立了专门评估语言的项目“聆听与说话”，并在“活动”维度增加了“自然/科学”的评估项目。

研究表明，婴幼儿的语言发展从生命早期就开始了。〔11〕一些纵向研究发现，儿童在婴幼儿时期阅读图书的频率对其日后的词汇量具有一定预测作用。〔12〕基于此，ITERS在语言评价方面新设了“图书的使用”项目。该项目主要用于评估图书的数量、图书的维护状态以及教师与婴幼儿共同阅读的机会与氛围。ITERS-R进一步突出了语言学习的重要性，新增了专门评估语言的项目“聆听与说话”，并沿用了ITERS中的语言评估项目“图书的使用”，同时新增了“帮助儿童理解语言”和“帮助儿童使用语言”两个项目。“帮助儿童理解语言”主要用于评估保教人员与婴幼儿交谈的频率、交谈的环境、交谈的方式、交谈的内容的适宜性。“帮助儿童使用语言”主要用于评估在婴幼儿主动尝试沟通时，保教人员的积极回应和消极回应的频率和方式。

20世纪80年代，美国学者雷翁勒德尔曼提出了“动手做”的教学法，即自己动手操作的探究式教学法。1993年，美国颁布《科学素质的衡量标准》，将培养儿童的科学素养作为美国学前儿童科学教育的重要目标。〔13〕基于此，ITERS-R在“活动”维度增加了“自然/科学”的评估项目。该项目主要用于评估自然/科学材料数量及材料的使用情况，参与户外体验活动的机会以及保教人员是否运用自然/科学事件与婴幼儿进行交谈。

2.更加强调语言互动、数学学习对婴幼儿认知发展的作用

从ITERS-R到ITERS-3，量表更加强调语言互动、数学学习对婴幼儿认知发展的作用。在ITERS-R的基础上，ITERS-3由重视语言到强调语言互动，从重视科学学习到重视数学学习，越来越精准地指向婴幼儿认知发展的核心要素。语言互动指保教人员与婴幼儿的口头及非言语交流。保教人员与婴幼儿的互动，尤其是积极的语言互动是支持婴幼儿社会情感、自我认知和调节机能发展的重要途径。〔14，15〕ITERS-3在第二代语言评估项目的基础上，新增了三个项目，分别是“鼓励词汇发展”“鼓励婴幼儿交谈”“保教人员与婴幼儿使用图书”。保教人员与婴幼儿的行为表现主要包括主动发起交谈、回应婴幼儿的交谈;主动与婴幼儿一起使用图书、鼓励婴幼儿使用图书等;鼓励词汇发展、鼓励婴幼儿运用词汇交谈。此外，ITERS-3越来越强调聚焦保教人员在不同的活动情境中对婴幼儿的语言指导。这也从侧面突显了语言互动对婴幼儿发展的重要作用。

数概念起源于婴幼儿早期。〔16〕研究表明，婴幼儿早期数学能力对其后来的学习成果具有一定预测作用，早期数学学习与阅读和写作也存在一定的关联性。〔17，18〕为突显婴幼儿数学学习的重要性，ITERS-3新增了关于数学的项目，主要用于评估数学活动材料的种类、使用情况以及保教人员在一日生活中运用数学材料与婴幼儿交流和沟通的情况。

3.逐渐从质量要素的静态评估走向动态评估

从ITERS-R到ITERS-3，美国《婴幼儿学习环境评量表》逐渐从质量要素的静态评估走向动态评估。0～3岁婴幼儿是在互动中，尤其是在与他人及材料互动中学习和发展的。〔19〕ITERS-3相较于ITERS-R，更加强调聚焦影响婴幼儿学习和发展的关键因素——互动，强调材料与婴幼儿的互动、保教人员在活动情境中与婴幼儿的互动。从质量要素的静态评估走向动态评估主要体现在量表的“活动”维度。

ITERS-R在构建“活动”维度的项目时，重在评估活动材料的数量及种类，将“不适宜”定位为活动材料不足、材料不卫生;“合格”定位为婴幼儿可以获得（活动材料储存在婴幼儿可以触及的地方）一些合适的活动材料;“良好”定位为婴幼儿在活动期间可以获得不同种类的材料;“优秀”定位为婴幼儿在活动期间可以获得种类丰富、层次多样的材料，保教人员参与婴幼儿的活动。ITERS-3在构建“活动”维度的项目时，削弱了对活动材料数量的要求，更为强调材料、保教人员与婴幼儿的互动，并将“不适宜”定位为活动材料不足、不卫生，保教人员长时间限制婴幼儿使用活动材料等;将“合格”定位为婴幼儿使用一些适宜的活动材料，保教人员同婴幼儿发生一些简短的、表层的交流与互动;将“良好”定位为婴幼儿使用不同种类的活动材料，保教人员就婴幼儿的活动进行深层次的交流与互动;将“优秀”定位为婴幼儿使用种类丰富、层次多样的材料，保教人员就婴幼儿的活动进行个性化的、拓展性的交流与互动。

四、启示

1.重視实证研究基础与多元化数据采集

研制科学的教育质量评价工具通常需要梳理大量的实证研究成果，并进行多元化的数据采集。在ITERS系列量表的编制和修订过程中，研究者检索了大量关于婴幼儿学习与发展的实证研究成果，以捕捉婴幼儿学习环境中的关键要素，从而建立起科学、有效的婴幼儿学习环境评价体系。借鉴此经验，我们在研制婴幼儿托育机构质量评价工具时，应当重视实证研究与多元化数据采集，尤其是纵向的追踪研究，找出婴幼儿终身发展所必需的能力，并找出促进这些能力发展所需要的环境支持，同时通过筛查、对比各国婴幼儿早期学习标准，找出婴幼儿托育中的关键要素，从而构建适宜有效的评价项目和指标。

多元化数据采集是保证评价工具科学有效的重要途径，其实施主要分为四个阶段。第一阶段是采集专家效度验证报告数据，测量评价工具的维度划分、指标等级设定的合理性与有效性。第二阶段是培养评分员，使评分员评分的一致性达到可接受水平，保证评分员所采集数据的有效性。第三阶段是进行小规模的试点测验，试测过程中需要考虑样本的代表性，抽样要具有梯度性，考察评价工具对于不同托育机构质量的敏感性。第四阶段是实施大规模的现场测验，通过这些现场测验来测量评价工具的可信程度和有效程度。在数据采集过程中，评价工具的研发者需要同使用者进行积极的研讨，以及时获取反馈，从而保证评价工具的科学性与实用性。多元化数据采集不仅可以用于测量评价工具的信效度，还可以用于评价工具的修订工作，如筛选有效指标、删除或调整无效指标等。

2.站在兒童的立场，重视教育环境与过程对婴幼儿语言、认知发展的支持

从ITERS到ITERS-3，历代量表的评分等级构建均站在儿童的立场，看待不同质量水平的学习环境对婴幼儿学习与发展的支持，时刻关注婴幼儿的实际体验。儿童立场是基于儿童的生存与发展方式，基于儿童对事物的观察与体验。儿童立场力图从儿童的视角看待问题，最大化地满足儿童的需要。为更好地促进婴幼儿发展，研发者在构建评价工具的框架和撰写指标时，应当思考“我”作为婴幼儿需要怎样的学习环境，如“我需要一定的活动空间与设施，以维持我的基本需要”“我需要有人对我悉心照护，以保证我的生理需要”“我需要有人和我一起开展活动，以满足我的互动需要”等。

从ITERS到ITERS-R，美国《婴幼儿学习环境评量表》的研发者通过借鉴各州的学习标准及实证研究成果，发现语言和科学学习对婴幼儿成长具有重要价值。从ITERS-R到ITERS-3，研究者们逐渐认识到婴幼儿是在互动中学习和发展的，因此ITERS-3在ITERS-R的基础上由重视语言到强调语言互动，从重视科学学习到重视数学学习，越来越精准地指向婴幼儿认知发展的核心要素。借鉴其经验，我们在研制婴幼儿托育机构质量评价工具时应当重视教育环境与过程对婴幼儿语言、认知发展的支持，在情境与互动中促进婴幼儿语言发展。例如，保教人员可以使用数学词汇去描述日常活动的顺序，如“我们现在第一个任务是打扫卫生，第二个任务是洗手，第三个任务是吃午饭”。

3.精准定位婴幼儿托育机构质量的进阶梯度，兼顾评估与质量提升的引领功能

历代ITERS量表均采用李克特七点计分法，以准确反映不同等级指标的观测点。我们在构建婴幼儿托育机构质量评价工具的不同水平和进阶梯度时，也可以借鉴《婴幼儿学习环境评量表》的研制思路，明确不同等级下保教人员的教育实践和婴幼儿的行为表现，同时将结构性质量与过程性质量进行不同水平的区分。例如，在“活动”维度，“不适宜”重在评估结构性质量——有无适宜的活动材料，“合格”兼顾结构性质量和过程性质量，强调婴幼儿使用适宜的、种类丰富的、具有一定层次性的材料，并强调保教人员基于婴幼儿当前的活动进行适宜的指导。另外，托育机构可以依据婴幼儿学习环境评价的指标体系和评分体系，分析保教人员在一日生活的不同环节和情境中的表现，并针对保教人员的薄弱之处给予客观和具体的改进建议，同时帮助保教人员了解不同情境下“良好”以及“优秀”的评价标准，从而不断提升托育机构的服务质量。

4.转变教育质量评估理念，从质量要素的静态评估走向相互作用的动态评估

从ITERS-R到ITERS-3，质量要素逐渐从静态评估走向相互作用的动态评估。这一质量评估理念的转变，主要体现在“活动”维度中逐渐削弱了对材料数量的评估，重在评估婴幼儿与材料的互动、保教人员在活动情境中与婴幼儿的互动。2019年10月，为加强托育机构专业化、规范化建设，国家卫生健康委组织制定了《托育机构设置标准（试行）》和《托育机构管理规范（试行）》。该标准对适用范围、设置要求、场地设施、人员规模等四方面的结构性指标作出了详细规定。为建立完善的婴幼儿托育机构质量评价体系，我们亟需转变教育质量评估理念，促使质量要素从静态评估逐渐走向动态评估。例如，在编制“活动”维度的评估项目时，可以依照我国的实际情况进行相应调整。活动的开展包括活动材料、活动时间、教师的指导。〔20〕根据活动构成三要素可以将活动开展分为以下四种情况：无材料、无活动、无指导;有材料、无活动、无指导;有材料、有活动、无指导;有材料、有活动、有指导。我们在构建本土化评估工具时，既需要汲取历代ITERS量表的研制经验，强调婴幼儿与材料的互动以及保教人员基于婴幼儿当前的活动与婴幼儿进行有效互动，又需要结合我国的实际情况，合理、有效地反映我国托育机构质量，杜绝“一刀切”的情况，从而客观反映托育机构质量，分析其存在的问题，进而精准地提升托育机构服务质量。

参考文献：

〔1〕BJ?RNESTAD E， ELLEN OS.Quality in Norwegian childcare for toddlers using ITERS-R〔J〕.European Early Childhood Education Research Journal，2017，（1）：111-127.

〔2〕GOELMAN H，FORER B，KERSHAW P，et al. Towards a predictive model of quality in Canadian child care centers〔J〕.Child Care Quarterly，2014，（6）：747-761.

〔3〕HELMERHORST K O W，RIKSEN-WALRAVEN J M A，GEVERS DEYNOOT-SCHAUB M J J M，et al.Child care quality in the Netherlands over the years：A closer look〔J〕.Early Education & Development， 2015，（1）：89-105.

〔4〕MCCARTNEY K，DEARING E，TAYLOR B A，et al.Quality child care supports the achievement of low-income children：Direct and indirect pathways through caregiving and the home environment〔J〕. Journal of Applied Developmental Psychology， 2007，（28）：411-426.

〔5〕MOORE G T.The evaluation of child care centers and the “infant/toddler environment rating scale”：An environmental critique〔J〕.Building Design， 1994，（1）：8-12.

〔6〕BISCEGLIA R，PERLMAN M，SCHAACK D，et al. Examining the psychometric properties of the infant-toddler environment rating scale-revised edition in a high-stakes context〔J〕.Early Childhood Research Quarterly，2009，（2）：121-132.

〔7〕HARMS T，CRYER D， CLIFFORD R M. Infant/toddler environment rating scale-third edition〔M〕.New York，NY：Teachers College Press，2017.

〔8〕SETODJI C M，LE V N，SCHAACK D.Using generalized additive modeling to empirically identify thresholds within the ITERS in relation to toddlers cognitive development〔J〕.Developmental Psychology，2013，（4）：632-645.

〔9〕CLIFFORD R M，YAZEJIAN N， CRYER D，et al.Forty years of measuring quality with the environment rating scales〔J〕.Early Childhood Research Quarterly，2020，51：164-166.

〔10〕CRYER D，TIETZE W，BURCHINAL M，et al.Predicting process quality from structural quality in preschool programs： A cross-country comparison〔J〕.Early ChildhoodResearch Quarterly，1999，（3）：339-361.

〔11〕JANE TORR.Infants experiences of shared reading with their educators in early childhood education and care centres：An observational study〔J〕.Early Childhood ResearchQuarterly，2019，（3）：519-529.

〔12〕FARRANT B M，ZUBRICK S R.Parent-child book reading across early childhood and child vocabulary in the early school years： Findings from the longitudinal study of Australian children〔J〕.First Language，2013，（3）：280-293.

〔13〕施燕.學前儿童科学教育〔M〕.上海：华东师范大学出版社，2006：23.

〔14〕BUYSE E，VERSCHUEREN K，DOUMEN S，et al.Classroom problem behavior and teacher-child relationships in kindergarten： The moderating role of classroom climate〔J〕. Journal of School Psychology，2008，（4）：367-391.

〔15〕EIJA PAKARINENA，MARJA-KRISTIINA LE?RKKANENB，ANNA-MAIJA POIKKEUSB，et al.A validation of the classroom assessment scoring system in finnish kindergartens〔J〕.Early Education & Development，2010，（1）：95-124.

〔16〕STARKEY P，SPELKE E S，GELMAN R.Numerical abstraction by human infants〔J〕.Cognition，1990，（2）：97-127.

〔17〕WATTS T W，DUNCAN G J，SIEGLER R S，et al.Whats past is prologue： Relations between early mathematics knowledge and high school achievement〔J〕.Educational Researcher，2014，（7）：352.

〔18〕DUNCAN G J，DOWSETT C J，CLAESSENS A，et al.School readiness and later achievement〔J〕.Developmental Psychology，2007，（6）：1428-1446.

〔19〕罗丽，刘昊.美国0～3岁婴幼儿托育服务机构质量评估中的CLASS：内容、特点与应用〔J〕.外国中小学教育，2018，（10）：45-54.

〔20〕LIU X，HU B，HUANG J，et al.The quality of play center activities of early childhood education in China〔J〕.English Language Teaching，2019，（8）：95-105.

【Abstract】American The Infant/Toddler Environment Rating Scale （ITERS） is the most widely used quality evaluation tool for childcare services for children aged 0-3. ITERS has been revised three times from ITERS to ITERS-3. Learning from American experience， we should pay attention to the foundation of empirical research and the collection of various types of data. We should also pay attention to the support of education environment and process for childrens language and cognition development from the standpoint of children， clarify the progressive stages of childcare services quality， and value the leading function of evaluation for quality improvement. We should change our ideas on education quality assessment， shifting from static assessment to interactive and dynamic assessment.

【Keywords】America ; The Infant/Toddler Environment Rating Scale ; childcare services quality ; intergenerational evolution; enlightenment