Preguntas orientadoras para elegir las herramientas adecuadas para medir los resultados de la primera infancia: ¿Por qué, Quién, Qué y Cómo? Adelle Pushparatnam, Jonathan Seiden, y Diego Luna-Bazaldua INTRODUCCION Una creciente comprensión de la importancia de los primeros años de los niños ha llevado a un deseo cada vez mayor de medir los resultados del desarrollo de la primera infancia (DPI). Hoy existen casi 150 herramientas para medir los resultados del DPI a nivel internacional,1 lo que puede dificultar la elección de una herramienta de medición adecuada para un esfuerzo de medición determinado. Estas herramientas varían ampliamente en términos de: • propósito para el cual fueron diseñados (por qué ), • poblaciones relevantes y rangos de edad de aquellos para quienes son apropiados usarlas (quién ), • información sobre el desarrollo infantil que producen, incluidas las habilidades, los ámbitos del desarrollo y los comportamientos que evalúan (qué ), • manera en que se administran (cómo ). Este documento orienta al usuario a través de las preguntas por qué , quién , qué , and cómo que se deben considerar antes de seleccionar herramientas para medir los resultados de DPI. Los usuarios deben documentar sus respuestas en cada paso para recopilar la información necesaria para identificar y seleccionar una herramienta de medición de DPI adecuada. 1 Para ver un inventario de las herramientas de medición de DPI, favor consultar el Inventario de medición de DPI que acompaña a la Caja de herramientas para medir el desarrollo de la primera infancia producido por el Fondo para la Evaluación Estratégica de Impacto Estratégico. El conjunto de herramientas también contiene información detallada sobre cómo medir el desarrollo infantil para niños de 0 a 8 años. Esta nota de orientación se basa en estos recursos integrales. PASO 1. Aclarar el propósito de la medición: el “por qué” Identificar claramente la justificación de la recopilación de información (en otras palabras, el por qué de recopilar datos) es la base principal para seleccionar una herramienta adecuada para medir los resultados del DPI. Desafortunadamente, este paso a menudo se omite y los usuarios se deciden por una herramienta sin asegurarse primero de que la herramienta esté bien alineada con los objetivos de sus esfuerzos de medición. Las diferentes herramientas están diseñadas para diferentes propósitos, como monitorear los resultados del DPI a nivel de la población o del sistema, evaluar a los niños que están en riesgo de retraso o evaluar el impacto de las intervenciones. Una falta de alineación entre el propósito de la medición y el diseño de la herramienta de medición puede limitar la utilidad de los datos recopilados y las conclusiones sobre el desarrollo infantil que se pueden extraer de los datos. Además, esta falta de alienación podría resultar en gastos ineficientes de recursos financieros y de tiempo, con los usuarios potencialmente gastando demasiado o muy poco en esfuerzos de medición teniendo en cuenta sus objetivos. A continuación se presentan cinco propósitos comunes de la medición de los resultados del DPI. • El seguimiento de la población consiste en medir los resultados del DPI de una gran muestra representativa de cierta población de niños pequeños. La recopilación de datos generalmente produce datos transversales en diferentes puntos en el tiempo (por ejemplo, una encuesta anual de niños de 3 a 5 años en un contexto determinado). En los estudios de seguimiento de la población, la atención se centra en la información agregada para describir las tendencias a nivel de la población en lugar de las puntajes individuales en los resultados del DPI de cada niño. Los resultados de DPI tienden a ser solo uno de los muchos aspectos que se miden como parte del esfuerzo de recopilación de datos; por lo tanto, los esfuerzos de medición con este propósito generalmente requieren herramientas de medición de DPI breves y holísticas. • La evaluación del programa/impacto evalúa cómo una política o intervención afecta los resultados de DPI. Por lo general, los datos se recopilan en múltiples puntos de tiempo (con al menos medidas de línea base y finales) y pueden intentar seguir longitudinalmente una muestra de niños en grupos de tratamiento y control. Quienes implementan evaluaciones de impacto generalmente desean herramientas de medición de DPI con alta confiabilidad para garantizar una medición precisa con un mínimo sesgo de medición.2 La cobertura de ámbito de las herramientas dependerá del enfoque de la intervención y puede abarcar un conjunto holístico de resultados de desarrollo o puede centrarse en habilidades específicas a las que se dirige la intervención (p. ej., habilidades de lectura fundamentales o desarrollo socioemocional). • Las evaluaciones formativas las utilizan con más frecuencia dentro de las aulas los docentes/cuidadores o líderes escolares para ajustar la práctica docente, brindar 2 La confiabilidad y el error de medición son conceptos interrelacionados en la medición psicológica. La confiabilidad se define como la medida en que los puntajes de evaluación están libres de errores de medición aleatorios; la confiabilidad se logra cuando hay consistencia en los puntajes a través de diferentes administraciones de la misma herramienta con el mismo niño, o cuando diferentes encuestadores tienen puntajes de prueba similares para el mismo niño. En el proceso de selección de una herramienta, asegúrese de que tenga evidencia documentada sobre su confiabilidad y validez. Los expertos en psicometría pueden brindar orientación especializada sobre estos aspectos técnicos durante el proceso de selección de herramientas. Por otro lado, el error de medición se refiere a la variabilidad no sistemática en los puntajes causada por factores no relacionados con el ámbito de desarrollo medido. Estos factores pueden incluir adivinar, ambigüedad en la administración de la evaluación o irregularidades en los puntajes asignados por los encuestadores. 2 retroalimentación constructiva a los niños y ofrecer oportunidades adicionales para promover el desarrollo y el aprendizaje. Por lo general, los resultados de las evaluaciones formativas no salen del entorno del aula/de la escuela y los docentes los utilizan para ofrecer apoyo personalizado a cada niño y a su clase en general. Las evaluaciones formativas generalmente se repiten con frecuencia y no se utilizan para la toma de decisiones de alto impacto. • El screening para evaluación o diagnóstico adicional se lleva a cabo para identificar niños individuales que pueden estar en riesgo de retrasos en el desarrollo y para ayudar a los niños a acceder a otros servicios necesarios. Los resultados de las herramientas de screening por sí solos suelen ser insuficientes para diagnosticar a los niños y, en cambio, se utilizan para referir a los niños a profesionales para una evaluación y apoyo adicionales. • La investigación para explorar relaciones o probar hipótesis la llevan a cabo con mayor frecuencia académicos y centros de investigación que estudian cómo se desarrollan los niños y qué factores influyen en su desarrollo. Los investigadores a menudo requieren una medición mucho más intensa, con frecuencia utilizan múltiples evaluaciones con los mismos niños en múltiples ocasiones, pero generalmente usan muestras más pequeñas que en la evaluación de impacto o el monitoreo de la población. Una consideración adicional que abarca los propósitos enumerados anteriormente es la necesidad de datos que sean comparables entre diferentes grupos y contextos. La comparabilidad de los datos es importante cuando existe la intención de comparar los resultados de DPI entre diferentes poblaciones (por ejemplo, comparando datos entre países, regiones o contextos culturales), pero también es relevante cuando existe la intención de comparar los resultados entre subgrupos dentro de una población determinada (p. ej., comparación de datos por género, grupos de edad, etnias, grupos urbanos y rurales, entre otros). Si hay múltiples propósitos que deben lograrse debido a las diversas necesidades de información de las partes interesadas, es probable que se requieran múltiples enfoques y herramientas de medición para cumplir con cada propósito, ya que es muy poco probable que una sola herramienta produzca datos óptimos para múltiples propósitos. El uso de múltiples herramientas y enfoques tendrá implicaciones en cuanto al tiempo, los recursos humanos y financieros necesarios para lograr estos múltiples propósitos. La Tabla 1 al final de este documento ilustra cómo identificar el propósito de la medición puede afectar las respuestas a las otras preguntas al seleccionar una herramienta. PASO 2. Identificar la población de interés: el “quién” Después de identificar por qué se están recopilando datos, la siguiente consideración al seleccionar una herramienta de medición de DPI es considerar quién es la población objetivo de interés. • La edad suele ser el factor más importante a considerar: muchas herramientas de medición sólo son relevantes para un rango de edad limitado (por ejemplo, de 0 a 3 y de 4 a 6 años son rangos de edad comunes). Cuando varios rangos de edad son de interés, o cuando se espera que la recopilación de datos siga a los niños a lo largo del tiempo, es fundamental encontrar una herramienta de medición, o múltiples herramientas, con una cobertura de edad adecuada. • También se deben considerar los aspectos regionales, lingüísticos o culturales de la población. Algunas herramientas están diseñadas para ser relevantes a nivel mundial y están disponibles en docenas de idiomas, mientras que otras están diseñadas para ser usadas en un país, en un contexto o en una región en particular. La mayoría de las herramientas globales 3 de medición de DPI intentan capturar aspectos universales del desarrollo, pero pueden pasar por alto importantes aspectos específicos del contexto del desarrollo. Por el contrario, las herramientas altamente contextualizadas ofrecen profundidad adicional, pero esto puede ser a expensas de una comparabilidad y generalización limitadas de los resultados a otros contextos. Un enfoque para equilibrar la relevancia contextual y la comparabilidad global es incorporar un conjunto central de elementos globales estándar a través de los esfuerzos de medición, y complementar este conjunto central con elementos contextualmente específicos que aborden las necesidades de información local. Independientemente de la herramienta seleccionada, a menudo se requieren actividades de traducción y adaptación cuando se utiliza una herramienta en un nuevo contexto cultural y lingüístico. • El estado/la capacidad de desarrollo de la población de interés influye en el tipo de evaluación que se utiliza. Las herramientas de medición de DPI diseñadas para su uso con niños de desarrollo típico pueden no ser apropiadas cuando se evalúa a niños con retrasos en el desarrollo o con discapacidades. PASO 3. Mapear los dominios o resultados relevantes de DPI: el “qué” El qué de la medición requiere una articulación clara de qué tipo de puntajes el usuario pretende recolectar y usar. Las herramientas de medición de DPI pueden generar un puntaje general del desarrollo que capture la información de los resultados del DPI en múltiples ámbitos del desarrollo, como el desarrollo psicomotor, del lenguaje o socioemocional. Las herramientas de medición también pueden generar puntajes específicos de ámbito que se centran en una gama estrecha de habilidades específicas o ámbitos de desarrollo. Algunos de los ámbitos más comúnmente cubiertos por las herramientas de medición de DPI incluyen:3 • Habilidades cognitivas incluyendo la memoria de los niños y las habilidades para resolver problemas. • Habilidades lingüísticas necesarias para expresar y comprender el lenguaje. • Habilidades numéricas usadas comúnmente para comparar cantidades, identificar y usar números y realizar operaciones aritméticas básicas. • Función ejecutiva y la capacidad de los niños para controlar las inhibiciones, centrar su atención y regular su comportamiento. • Habilidades motoras incluyendo la motricidad fina y gruesa. • Habilidades socioemocionales, incluyendo el conocimiento emocional de los niños y la resolución de conflictos. Las herramientas que generan puntajes generales de desarrollo intentan medir una variedad de ámbitos de desarrollo en una sola herramienta. Cada herramienta de medición tiene una cobertura 3 No existe una lista completa única de todos los ámbitos del desarrollo identificados en la literatura sobre la primera infancia. La Tabla 3.1 de un conjunto de herramientas para medir el desarrollo de la primera infancia en países de ingresos bajos y medianos incluye nueve ámbitos, que se pueden subdividir en subámbitos. La Figura 2.3 en el Conjunto de herramientas también demuestra cómo la relevancia de varios ámbitos del desarrollo varía a lo largo de las diferentes edades. 4 de ámbito ligeramente diferente, pero normalmente intenta cubrir tres o más ámbitos. Las herramientas más cortas que se utilizan a menudo en el seguimiento de la población normalmente sólo generan un puntaje general de desarrollo. Los puntajes específicos de ámbito se generan en función de la capacidad del niño en un conjunto específico de habilidades. Algunas herramientas de medición de resultados de DPI se enfocan en subámbitos aún más específicos dentro de un ámbito de desarrollo más amplio, que incluye habilidades motoras finas, habilidades de lenguaje expresivo, auto-reconocimiento de emociones o memoria a corto plazo. Los usuarios deben examinar en detalle los ámbitos y subámbitos que cubre cada herramienta; por lo general, esta información detallada se incluye en el marco de evaluación, los informes y los manuales para los encuestadores. Las recopilaciones de datos más complejas pueden requerir múltiples herramientas para garantizar una cobertura de ámbito adecuada o capturar tendencias de desarrollo a lo largo del tiempo, especialmente para proyectos de investigación y algunas evaluaciones de programa/impacto. Las herramientas específicas de ámbito se usan más comúnmente en evaluaciones de impacto de políticas que evalúan los efectos de programas/intervenciones específicas en habilidades específicas, evaluaciones formativas personalizadas o proyectos de investigación que intentan comprender profundamente el desarrollo en un ámbito particular. PASO 4. Considerar las realidades logísticas de la recopilación de datos: el “cómo” Después de aclarar el por qué , el quién , y el qué de la recopilación de datos, las realidades logísticas de cómo se recopilarán los datos enmarcan preguntas importantes sobre qué herramienta de medición de resultados de DPI elegir. Los factores que se describen a continuación pueden ayudar a determinar qué herramienta de medición es factible para usar en un esfuerzo de recopilación de datos, particularmente si se debe usar una herramienta que involucre la evaluación directa o indirecta del niño. Las herramientas de evaluación directa utilizan encuestadores capacitados para involucrar a los niños en una serie de juegos, tareas o actividades siguiendo un protocolo definido. Las herramientas de evaluación indirecta dependen de los padres, cuidadores, docentes u otras partes interesadas para responder preguntas sobre el desarrollo individual de los niños. Cuando sea posible, el uso conjunto de herramientas de evaluación indirectas y directas brinda una valiosa oportunidad para triangular los datos recopilados de diferentes fuentes, lo que aumenta la credibilidad de los resultados de un esfuerzo de medición determinado. Cuando la evaluación directa e indirecta no es una opción, algunos factores que juegan un papel en la decisión de utilizar una herramienta de evaluación directa o indirecta incluyen lo siguiente: • El contexto de la recopilación de datos puede definir qué modalidades de evaluación son factibles. Si la recopilación de datos se llevará a cabo en los centros de DPI o en las aulas de preescolar, puede ser más fácil evaluar a los niños directamente o depender de las medidas informadas por los docentes que encuestar a los padres o cuidadores. Los esfuerzos de recopilación de datos en el hogar brindan la mayor flexibilidad. Las encuestas electrónicas o telefónicas hacen que la evaluación directa sea un desafío y, por lo general, utilizan evaluaciones informadas por los padres, cuidadores o maestros. • La intensidad de la capacitación varía dependiendo de la modalidad de evaluación de una herramienta dada. Si bien todas las herramientas requieren capacitación para garantizar una administración confiable, las evaluaciones directas generalmente requieren una capacitación 5 más prolongada y compleja para garantizar la estandarización adecuada, la comprensión de los protocolos de administración de la evaluación y la garantía de calidad. Las herramientas de evaluación directa también suelen requerir administradores con más calificaciones y/o experiencia relacionada con la medición del desarrollo infantil y la interacción con niños pequeños. La capacidad de los recolectores de datos y el tiempo disponible para la capacitación influye en cuán compleja puede ser la administración de la herramienta de medición. • El tiempo y la frecuencia de la recopilación de datos planificada puede influir en la elección de la herramienta de medición. Por lo general, las herramientas que implican la evaluación directa de los niños y que tardan más en administrarse son más útiles para recopilaciones de datos menos frecuentes pero más profundas. Los esfuerzos de recopilación de datos que deben llevarse a cabo con regularidad suelen ser mejor atendidos por herramientas más cortas y menos intensivas en recursos que los que se basan en evaluaciones indirectas. • Los costos de implementar herramientas de medición también varían. Los recursos necesarios para capacitar a los encuestadores y el tiempo necesario por niño para implementar una herramienta determinada varían según la complejidad de la herramienta y la modalidad de evaluación. Las evaluaciones directas tienden a ser más complejas que las evaluaciones indirectas y, por lo tanto, requieren más tiempo y recursos para capacitar a los encuestadores e implementar las herramientas en el campo. Estos costos son particularmente importantes dentro de los esfuerzos de medición que deben repetirse con frecuencia a escala, como los esfuerzos de monitoreo y las evaluaciones formativas. Por otro lado, para la recolección de datos a menor escala y menos frecuente, puede ser factible e incluso deseable utilizar una herramienta potencialmente más compleja. Finalmente, al pensar en el “cómo ” de la recopilación de datos, vale la pena considerar si el esfuerzo de medición de DPI podría incorporarse a las iniciativas de recopilación de datos en curso (por ejemplo, encuestas existentes de hogares, sistemas de información de gestión educativa (EMIS), etc.), ya que esto podría crear eficiencias en términos de los recursos necesarios para recopilar los datos. También podría haber esfuerzos previos de medición de DPI realizados por otras partes interesadas de las que el usuario podría sacar provecho. Por ejemplo, puede que existan datos que el usuario podría usar, herramientas que ya se han adaptado a un contexto determinado o lecciones aprendidas de experiencias pasadas de recopilación de datos. PASO 5. Consolidar información y seleccionar una evaluación Después de documentar las consideraciones a las que llevan los pasos anteriores, el siguiente paso es identificar las posibles herramientas de medición que pueden ser adecuadas para el propósito. Para este paso, puede ser útil consultar el Inventario de medición de DPI para obtener una lista completa de 147 herramientas para niños de 0 a 8 años. Si bien no existe un enfoque generalizable para decidir la herramienta exacta para cada situación, los pasos anteriores se relacionan con las columnas de esta hoja de cálculo. Al filtrar por cada criterio, los usuarios pueden identificar un subconjunto de herramientas de medición que cumplen con los requisitos para un esfuerzo de medición de DPI determinado. 6 Después de identificar las posibles herramientas de medición de DPI para su uso, revise cada una y complete la siguiente lista de verificación para verificar que la herramienta cumpla con las necesidades específicas del esfuerzo de medición de DPI. El propósito de la medición está claramente definido y la herramienta fue diseñada para este propósito  identificado. Los ámbitos deseados del desarrollo infantil están cubiertos e incluyen un nivel suficiente de  profundidad para permitir informes específicos del ámbito si se desea. La herramienta cubre la(s) edad(es) relevante(s). Para estudios longitudinales o mediciones repetidas  de una muestra dada, es importante asegurarse de que la herramienta seleccionada cubra las edades relevantes en todos los puntos temporales de recopilación de datos.4 La naturaleza directa/indirecta de la evaluación está alineada con los puntos de acceso a la  recopilación de datos. La evaluación es relevante en el contexto cultural/lingüístico de interés, o existen el tiempo y los  recursos adecuados para traducir y adaptar la evaluación. Hay recursos disponibles necesarios para cubrir las tarifas de licencia asociadas con la implementación  de la herramienta (si corresponde; algunas herramientas son gratuitas y están públicamente disponibles para su uso). Los requisitos de capacitación son razonables dada la capacidad del encuestador, el tiempo disponible  para la capacitación y los recursos disponibles. El costo de la recopilación de datos y los requisitos de tiempo son razonables teniendo en cuenta la frecuencia deseada de la recopilación de datos. CONCLUSION En los últimos años ha habido una proliferación de herramientas de medición de DPI. Las preguntas clave de por qué , quién , qué , y cómo presentadas anteriormente (también resumidas en la Tabla 1 a continuación) brindan una hoja de ruta para seleccionar herramientas que sean adecuadas para el propósito dentro de un esfuerzo de medición de DPI determinado. Elegir una herramienta apropiada es crucial para el éxito de un esfuerzo de medición dado, ya que determina si el esfuerzo de medición producirá datos relevantes y creíbles que satisfagan las necesidades de información de las partes interesadas objetivo. 4 En algunos estudios longitudinales, es posible que no haya una sola herramienta que cubra todo el rango de edad de la población objetivo de niños en todos los puntos de tiempo. En esos casos, los usuarios pueden necesitar dos o más herramientas que cubran todo el rango de edad de los niños para el estudio. En cada ronda de recopilación de datos, utilice la(s) herramienta(s) específica(s) que alinean la cobertura de edad con las edades de los niños evaluados. Para aumentar la comparabilidad de los puntajes de dos o más herramientas, asegúrese de que miden los mismos ámbitos de desarrollo y compartan algunos elementos comunes. Consulte con un psicometrista sobre los procedimientos técnicos para producir puntajes equivalentes para sus herramientas seleccionadas. 7 ANEXO Tabla 1. Compendio de consideraciones para la selección de evaluación de DPI Identificar el propósito previsto de la medición ayuda a responder otras preguntas relacionadas con la selección de la evaluación. A continuación se presentan cinco de los propósitos más comunes de la medición, junto con una descripción de cómo cada propósito afecta las respuestas a otras preguntas. Seguimiento de Evaluación de Investigación Formativo Screening la población impacto Por lo general, Medir el efecto de un Generar un Ayudar a un docente Identificar a los niños para comprender programa o política conocimiento más individual o a un en riesgo de evaluación (¿Por Propósito de la el estado de en el desarrollo profundo del facilitador de DPI a discapacidad o desarrollo de una infantil desarrollo infantil y comprender la retraso en el qué?) población general, sus capacidad de la desarrollo para la a menudo para determinantes/correl clase/grupo para intervención realizar un atos informar y mejorar la seguimiento de los práctica cambios a lo largo del tiempo. ¿Enfoque Por lo general, una Puede ser una Puede ser una Por lo general, un Puede ser una Población de interés de la amplia muestra muestra muestra pequeño grupo de población amplia o muestra? representativa de representativa de representativa de niños en un entorno una subpoblación una población una población amplia una población amplia de cuidado infantil o específica, a menudo (¿Quién?) dada o una subpoblación o una subpoblación preescolar. en riesgo de retraso específica específica en el desarrollo o discapacidad ¿Edad? Determinado por el Determinado por el Determinado por el Se usa con más Determinado por el enfoque del esfuerzo enfoque del esfuerzo enfoque del esfuerzo frecuencia para niños enfoque del esfuerzo de medición de medición de medición en edad preescolar. de medición Por lo general, Por lo general, Puede ser tanto Puede ser tanto Puede ser holístico o formación de DPI puntajes holísticos puntajes holísticos holístico como holístico como centrado en el deseada (¿Qué?) del desarrollo de la del desarrollo de la centrado en el centrado en el ámbito, ámbito o las primera infancia; en primera infancia; en ámbito, según la según la naturaleza habilidades según los algunos casos, es algunos casos, es naturaleza del del programa/política objetivos del posible que se posible que se programa/política que se esté docente/facilitador necesiten puntajes necesiten puntajes de que se esté evaluando; muchos de DPI de ámbitos ámbitos específicos evaluando; muchas proyectos de específicos relevantes relevantes para la evaluaciones usan investigación usan para la política política múltiples medidas múltiples medidas ¿Entorno A menudo junto La recopilación de La recopilación de La recopilación de Recopilación común de la con grandes datos en el centro y en datos en el centro y en datos basada en el en centros y clínicas; Realidades logísticas de la recopilación de recopiació encuestas de el hogar es común; la el hogar es común; la centro es más común a veces se incluye en hogares recopilación de datos recopilación de datos la recopilación de n? basada en el centro es basada en el centro es datos en el hogar más común para los más común para los niños mayores niños mayores ¿Directo/i Indirecto más Ambos son comunes Ambos son comunes Directo más común Indirecto más común datos (¿Cómo?) ndirecto? común ¿Tiempo? Anualmente/seme Por lo general, al Por lo general, al Por lo general, se A menudo se lleva a stralmente/interval menos dos veces, de menos dos veces de realiza varias veces al cabo en etapas clave os regulares acuerdo con la acuerdo con las año del desarrollo infantil. implementación del preguntas de programa/política investigación. ¿Quién Por lo general, Por lo general, equipos Por lo general, equipos Por lo general, A menudo realizado recopila? equipos de de encuestadores de encuestadores docentes/ por encuestadores capacitados; algunas capacitados; algunas facilitadores de DPI paraprofesionales capacitados herramientas herramientas capacitados o requieren requieren equipos de encuestadores con encuestadores con encuestadores mayor capacidad y/o mayor capacidad y/o capacitados capacitación intensiva. capacitación intensiva. RECURSOS ADICIONALES Fernald, L. C., Prado, E., Kariger, P., & Raikes, A. (2017). A toolkit for measuring early childhood development in low and middle-income countries. Washington, D.C.: World Bank. Website: https://openknowledge.worldbank.org/handle/10986/29000 Early Learning Partnership (2016). Measuring child development and early learning. Washington, D.C.: World Bank. Website: https://documents1.worldbank.org/curated/en/659701473955877219/pdf/108286-REVISED-PUBLIC- ELP-IB4-MeasuringCD-v7-CEP.pdf © 2022 The World Bank 1818 H Street NW, Washington DC 20433 Telephone: 202-473-1000; Internet: www.worldbank.org Algunos derechos reservados Este trabajo es producto del personal del Banco Mundial. Los hallazgos, interpretaciones y conclusiones expresados en este trabajo no reflejan necesariamente las opiniones de los Directores Ejecutivos del Banco Mundial o los gobiernos que representan. El Banco Mundial no garantiza la exactitud de los datos incluidos en este trabajo. Los límites, colores, denominaciones y otra información que se muestra en cualquier mapa en este trabajo no implican ningún juicio por parte del Banco Mundial con respecto al estatus legal de cualquier territorio o el respaldo o aceptación de tales límites. DERECHOS Y PERMISOS El material de este trabajo está sujeto a derechos de autor. Debido a que el Banco Mundial fomenta la difusión de su conocimiento, este trabajo puede reproducirse, en su totalidad o en parte, con fines no comerciales, siempre que se dé la atribución total a este trabajo. Atribución— Por favor cite el trabajo de la siguiente manera: “Pushparatnam, Adelle, Jonathan Seiden y Diego Luna - Bazaldua. 2022. Preguntas Orientadoras para Elegir las Herramientas Adecuadas para Medir los Resultados de la Primera Infancia: Por qué, Quién, Qué y Cómo. Washington, DC: Banco Mundial. Creative Commons Attribution CC BY 4.0 IGO. Todas las consultas sobre derechos y licencias, incluíos los derechos subsidiarios, deben dirigirse a World Bank Publications, Grupo Banco Mundial, 1818 H Street NW, Washington, DC 20433, EE UU.; fax: 202-522-2625; Email: pubrights@worldbank.org. Diseño de gráficos y maquetación: Danielle Willis Para obtener más información sobre el trabajo de Desarrollo de la Primera Infancia del Banco Mundial: http://www.worldbank.org/en/topic/earlychildhooddevelopment#3 Para obtener más información sobre la Asociación de Aprendizaje Inicial del Banco Mundial: http://www.worldbank.org/en/topic/education/brief/early-learning-partnership Esta nota de orientación fue financiada por Early Learning Partnership (ELP). Nos gustaría agradecer a Marie- Helene Cloutier, Alisa Currimjee, Amanda Devercelli, Elaine Ding y Melissa Kelly por sus comentarios sobre las versiones anteriores de la nota. También nos gustaría agradecer el apoyo del equipo más amplio de ELP, dirigido por Amanda Devercelli bajo la dirección de Omar Arias, Gerente de Práctica del Equipo de Innovación y Conocimiento Global de la Práctica Global de Educación del Banco Mundial.