Investigaciones de diseño
Desarrollo de la argumentación científica con Universe Sandbox en la enseñanza de la gravitación
Development of scientific argumentation with Universe Sandbox in the teaching of gravitation
Desarrollo de la argumentación científica con Universe Sandbox en la enseñanza de la gravitación
Revista Eureka sobre Enseñanza y Divulgación de las Ciencias, vol. 23, núm. 1, pp. 180301-180321, 2026
Universidad de Cádiz
Recepción: 30 Marzo 2025
Revisado: 11 Noviembre 2025
Aprobación: 21 Enero 2026
Resumen: Esta investigación evalúa la evolución de la estructura argumentativa de 53 estudiantes de secundaria al abordar la Ley de Gravitación Universal, mediante una Secuencia de Enseñanza-Aprendizaje basada en el ciclo 5-E y el marco CERR (Claim, Evidence, Reasoning, Rebuttal). A partir de un diseño metodológico mixto se comparó el desempeño argumentativo en dos iteraciones: una basada en experimentación física y otra mediada por el software de simulación Universe Sandbox. Los resultados evidencian una progresión en la calidad de los argumentos. Si bien la fase experimental presentó desafíos en la formulación de justificaciones, la integración del software permitió al estudiantado generar datos virtuales para construir pruebas y mejorar su capacidad de refutación y razonamiento. Se concluye que la simulación computacional facilitó la visualización de fenómenos abstractos, actuando como una herramienta epistémica para sofisticar la práctica argumentativa científica en el aula.
Palabras clave: Ley de Gravitación Universal, Argumentación Científica, Universe Sandbox, Secuencia de Enseñanza Aprendizaje.
Abstract: This research evaluates the evolution of the argumentative structure of 53 secondary school students when addressing the Universal Law of Gravitation, through a Teaching-Learning Sequence based on the 5-E instructional model and the CERR (Claim, Evidence, Reasoning, Rebuttal) framework. From a mixed-methods design compared argumentative performance across two iterations: one based on physical experimentation and another mediated by the Universe Sandbox simulation software. The results demonstrate a progression in the quality of arguments. While the experimental phase presented challenges in the formulation of scientific explanations, the integration of the software allowed students to generate virtual data to construct evidence and improve their rebuttal and reasoning capacities. It is concluded that the computer simulation facilitated the visualization of abstract phenomena, serving as an epistemic tool to refine scientific argumentative practice in the classroom.
Keywords: Law of Universal Gravitation, Scientific Argumentation, Universe Sandbox, Teaching and Learning Sequence.
Introducción
Una de las metas centrales en la educación científica del siglo XXI es formar ciudadanos que posean una confianza informada en la ciencia y tengan un rol competente en ella (Osborne y Allchin, 2024). Se busca ser capaz de comprender la ciencia, evaluarla críticamente y participar en los discursos que moldean la sociedad. Sin embargo, la persistencia de concepciones alternativas sobre conceptos centrales de la Física, como la Ley de Gravitación Universal (LGU), representa un desafío en educación científica. Estudios como los de Kavanagh y Sneider (2006), Métioui y Trudel (2021) o Juita et al. (2023) evidencian que tanto estudiantes como profesores mantienen ideas intuitivas alejadas de los modelos científicos sobre la gravedad, el peso en órbita y la atracción gravitatoria. Al respecto, Kavanagh y Sneider (2006) señalan como ejemplo la idea de que la atracción gravitatoria requiere de una atmósfera para actuar, lo cual lleva al alumnado a concluir que en la Luna los objetos flotan por un vacío o que la gravedad desaparece al salir de la Tierra.
Si el estudiantado no logra transformar estas ideas intuitivas en Grandes Ideas de la Ciencia, se limita su capacidad para explicar fenómenos del mundo real (Harlen, 2015). Superar estas barreras conceptuales se vuelve importante para que los estudiantes puedan analizar temas socio-científicos actuales, como el funcionamiento de las redes satelitales globales o la viabilidad de futuras misiones interplanetarias (Liou y Johnson, 2006). Esta conexión con problemas reales sienta las bases para el desarrollo de una competencia esencial en la alfabetización científica: la argumentación (Osborne y Allchin, 2024).
Para algunos autores, la argumentación científica se entiende como una competencia (Jiménez-Aleixandre, 2010), la cual se manifiesta a través de la práctica de justificar afirmaciones (Krajcik y McNeill, 2015), siendo fundamental para construir y evaluar conocimiento en base a las pruebas (Ageitos et al., 2017). No obstante, su aplicación en la enseñanza de la Física en secundaria, específicamente en temas como la LGU, ha sido poco explorada (Erduran y Park, 2023). McNeill y Martin (2011) enfatizan que la falta de argumentación es un problema, ya que esta competencia proporciona las herramientas para comunicar ideas de manera precisa y profundizar la comprensión científica. Además, fomenta el pensamiento crítico y la capacidad de respaldar posturas con evidencias (Krajcik y McNeill, 2015).
En cuanto a la enseñanza de la LGU, si bien hay currículos que declaran objetivos cualitativos para la comprensión de fenómenos (C.f. MINEDUC, 2018, 2021), la práctica pedagógica suele priorizar la ecuación matemática aislada (Young y Freedman, 2018). Esto limita la conexión intuitiva con el fenómeno físico (Galili et al., 2017; Toledo et al., 2020) y dificulta reconocer la interacción gravitatoria en diversas problemáticas (Viau y Moro, 2013). Sin embargo, estudios como el de Teixeira et al. (2015) han demostrado que abordar la LGU desde la estructura argumentativa, utilizando enfoques histórico-filosóficos, favorece la calidad y complejidad de los argumentos construidos por los estudiantes.
Considerando los antecedentes expuestos y, resaltando el poder predictivo y explicativo de la LGU (Develaki, 2012), esta investigación presenta una secuencia de enseñanza-aprendizaje (SEA) diseñada para fomentar el desarrollo de la argumentación científica y aproximar al estudiantado a los modelos científicos vigentes. La SEA se articula en torno a las Grandes Ideas de la Ciencia (Harlen, 2015), específicamente la noción de interacción a distancia mediante el campo gravitatorio. El diseño contempla dos iteraciones: una basada en experimentos físicos y análisis de datos, y otra que integra el software Universe Sandbox, herramienta que permite la exploración y visualización de fenómenos astronómicos.
La investigación tuvo por objetivo evaluar el desarrollo de la argumentación científica en estudiantes de secundaria que vivenciaron esta SEA, buscando responder: ¿cómo es el desarrollo de la estructura argumentativa en estudiantes de secundaria al aprender la Ley de Gravitación Universal en una secuencia basada en el marco CERR con el uso del software Universe Sandbox?, y ¿cuál es la contribución específica de este software para la argumentación científica en la propuesta?
Marco Teórico
Argumentación Científica bajo el marco CERR
La argumentación científica se aborda en esta investigación como una práctica científica (McNeill y Krajcik, 2008). El ejercicio de esta práctica pone en acción la competencia epistémica, definida por Jiménez-Aleixandre (2010) como la capacidad de evaluar enunciados de conocimiento ante las pruebas disponibles. Esta perspectiva permite comprender el vínculo entre argumentar y aprender ciencias: el proceso argumentativo incentiva al estudiantado a externalizar sus modelos mentales y someterlos a juicio frente a la evidencia, promoviendo así la reestructuración conceptual (Osborne, 2010).
La SEA propuesta se centró en la argumentación científica escolar, fundamental para desarrollar habilidades de comunicación, justificación, pensamiento crítico y defensa de ideas científicas del estudiantado. En este escenario, McNeill y Martin (2011) proponen el marco Claim, Evidence and Reasoning (CER). En este, los estudiantes inician con afirmaciones (Claim) sobre un fenómeno científico, haciendo declaraciones iniciales que los posicionen en una postura. Es importante destacar que, bajo la evaluación de este estudio, una afirmación de nivel alto implica necesariamente precisión conceptual, reflejando la adopción de los modelos científicos vigentes.
Luego fortalecen sus argumentos presentando pruebas (Evidence) con datos científicos (observaciones, mediciones, investigaciones) que respaldan su afirmación. Posteriormente, elaboran razonamientos (Reasoning) científicamente sólidos que establezcan la relación lógica entre pruebas y afirmación, explicando cómo tener pruebas apoya su postura inicial. Este marco simplifica la práctica argumentativa y facilita la comunicación efectiva de explicaciones científicas, ofreciendo guías para desarrollar una estructura argumentativa eficaz que puede complementarse con otras herramientas pedagógicas (Samosa, 2021).
Para la construcción de la SEA, se adoptó una extensión del marco CER que incorpora la refutación (Rebuttal). Así, el marco CERR agrega que se debe comunicar posibles explicaciones alternativas y argumentar, con pruebas y razonamiento, por qué estas no son apropiadas (Krajcik y McNeill, 2015). Este componente contribuye a un aprendizaje profundo, ya que exige al estudiantado contrastar explícitamente las Grandes Ideas de la Ciencia (Harlen, 2015) frente a concepciones alternativas, validando así la robustez de sus nuevos modelos mentales.
La SEA considera tareas basándose en las diferentes categorías del marco CERR, permitiendo monitorear el progreso de estudiantes tanto en la estructuración de sus argumentos como en la evolución de sus ideas científicas.
Progresión del aprendizaje mediante ciclo 5-E para la sofisticación de modelos escolares
Considerando las dificultades intrínsecas de la LGU, como su naturaleza abstracta y la contraintuitividad de la acción a distancia, la SEA se estructuró disciplinariamente bajo las Grandes Ideas de la Ciencia (Harlen, 2015). Se organizó una progresión de ideas que avanza desde lo fenomenológico (caída libre) hacia lo abstracto (gravitación universal), utilizando la modelización mediada por software para visibilizar estas interacciones invisibles. Este enfoque busca relevar la importancia de la LGU para una ciudadanía competente, capaz de argumentar sobre problemáticas socio-científicas contemporáneas.
Para operacionalizar el diseño, se utilizó el ciclo de aprendizaje 5-E (Bybee, 2015), entendido como una ruta para la evolución de los modelos escolares. El ciclo consta de cinco fases: Enganche: activa el interés y exterioriza los modelos iniciales del estudiantado frente a un fenómeno; Exploración: provee experiencias prácticas y simulaciones para probar los modelos y evidenciar sus limitaciones explicativas (en lugar de solo identificar errores); Explicación: fase en que se introducen formalmente los modelos científicos (Harlen, 2015) para robustecer los argumentos del estudiantado; Elaboración: aplicar los nuevos modelos a contextos complejos y socialmente relevantes (ciudadanía); y Evaluar: valora el progreso en la sofisticación de la estructura argumentativa y la comprensión del modelo.
Modelos científicos escolares
El aprendizaje de la LGU conlleva el desafío de superar explicaciones de sentido común que, aunque funcionales en la vida diaria, difieren de los modelos científicos. En lugar de catalogar estas ideas como errores conceptuales, esta investigación adopta la perspectiva de la modelización, entendiendo que el estudiantado posee modelos explicativos escolares que deben evolucionar (Oliva, 2019).
La argumentación actúa como un generador de cambio al requerir que el estudiante justifique sus afirmaciones con pruebas y realice refutaciones. Se propicia la revisión y refinamiento de sus modelos mentales iniciales hacia modelos más cercanos al científico, alineándose con las Grandes Ideas de la Ciencia sobre la interacción a distancia (Harlen, 2015).
El rol de las simulaciones y la visualización en astronomía
Dada la escala astronómica y la abstracción de la LGU, la experiencia directa es limitada. Por lo que los modelos computacionales dinámicos son entornos efectivos para que el estudiantado obtenga sus propias pruebas mediante la experimentación virtual, permitiéndoles aislar causas y efectos en sistemas complejos para fundamentar sus afirmaciones científicas (Pallant y Lee, 2015). En este contexto, las simulaciones computacionales, como Universe Sandbox, funcionan como una herramienta para la obtención de pruebas y manipulación hipotética de variables (masa, distancia). Como señalan De Jong et al. (2013), los entornos virtuales son insustituibles cuando la experimentación física es inviable, permitiendo al estudiantado realizar indagaciones auténticas y recolectar datos para probar sus hipótesis. Así, la simulación digital es un potencial en la educación científica para visualizar fenómenos abstractos y fomentar el aprendizaje activo (Kefalis et al., 2025).
Metodología
La presente investigación adopta un enfoque metodológico mixto, caracterizado por la recolección de datos cualitativos —provenientes de las producciones escritas y argumentos del estudiantado en fichas de trabajo— que fueron sometidos a un proceso de codificación y cuantificación (Creswell y Plano-Clark, 2018). Se utilizaron rúbricas interpretativas basadas en el marco CERR para transformar las respuestas abiertas en escalas ordinales (niveles 0, 1 y 2), permitiendo un análisis descriptivo de la evolución de la estructura argumentativa a lo largo de la SEA.
Para garantizar la validez de contenido, el diseño y construcción de las tareas contó con la asesoría de una experta externa a la investigación. Asimismo, para asegurar la confiabilidad en la codificación de los argumentos, el análisis de las respuestas fue realizado inicialmente por el autor implementador y posteriormente sometido a un proceso de triangulación y monitoreo por un investigador externo y el respaldo del segundo autor, reduciendo así los sesgos interpretativos.
Participantes e implementación
Los participantes del estudio fueron 53 estudiantes voluntarios de tres cursos de décimo grado con edades entre los 15 y 16 años, de un establecimiento educativo de Chile. Todos poseían los mismos conocimientos previos por cronología curricular (SEA implementada en la unidad El Universo, luego de la Unidad de Energía Mecánica y Cantidad de Movimiento [MINEDUC, 2018]).
La intervención constó de seis sesiones de 90 minutos cada una, integradas en el horario lectivo regular. La implementación fue conducida por el docente titular de la asignatura de Física, quien también es autor de esta investigación, asumiendo un rol de profesor-investigador. Este rol dual permitió una observación participante directa durante el desarrollo de las sesiones.
Se obtuvo la autorización formal de la dirección del establecimiento para la implementación de la secuencia didáctica y la recolección de datos. Respecto a los participantes, al tratarse de actividades insertas en el horario lectivo, se procedió mediante el asentimiento individual, donde cada estudiante manifestó explícitamente su voluntad de que sus producciones fueran utilizadas con fines investigativos, garantizándose el anonimato y que su decisión no tendría repercusión alguna en sus calificaciones. Por su parte, los padres y apoderados fueron debidamente notificados mediante una comunicación oficial informativa respecto a los objetivos y características del estudio, asegurando la transparencia del proceso.
Validación por pares del instrumento de recogida de datos
Cuatro expertos en Ciencias validaron las tareas de la SEA usando una matriz de suficiencia (tareas bastan para medir el objetivo), claridad (se comprenden las tareas fácilmente), coherencia (tareas relacionadas con el objetivo) y relevancia (la tarea es imprescindible para la SEA) evaluadas en escala de 1 a 4 (siguiendo a Galicia et al., 2017). La mayoría calificó con puntuación máxima (4), obteniéndose altos porcentajes de cumplimiento: Suficiencia: 98%, Claridad: 82%, Coherencia: 94% y Relevancia: 97%. Las tareas fueron posteriormente modificadas según las observaciones de los expertos evaluadores, agregándose cambios en redacción de enunciados, reducción de preguntas, forma general de tareas y se incluyeron instrucciones del uso de software mediante códigos QR.
Instrumento de evaluación de la estructura argumentativa
Los argumentos del estudiantado fueron registrados en fichas elaboradas a partir de cada etapa del ciclo 5-E y de las categorías del marco CERR de argumentación científica. A los registros escritos en todas las tareas, se les asignó un puntaje con base en la rúbrica de evaluación del marco CERR estipulada por Krajcik y McNeill (2015) (Tabla 1). La asignación se realizó por el autor que implementó la SEA en consenso con un investigador externo a este escrito y respaldado por el segundo autor.

La estructura argumentativa fue sometida a un análisis longitudinal con esta rúbrica, de modo que en todas las fichas se procedió al análisis de los componentes del marco CERR que se trabajaron en cada una de las tareas.
Diseño y justificación de la SEA
Considerando las preconcepciones, el marco teórico y el currículo escolar, se adaptaron objetivos de aprendizaje e indicadores de evaluación ministerial (MINEDUC, 2018, 2021). A partir de estos, se definieron cinco ejes temáticos sobre la LGU: Gravedad Terrestre, Variables involucradas, Gravitación entre planetas, Gravitación en Sistemas Solares y la Ecuación de la LGU. Estos ejes se abordaron en ocho fichas de trabajo diseñadas para integrar la argumentación científica bajo el marco CERR con conceptos de gravitación, progresando desde lo tangible a lo abstracto. Esta combinación de argumentación y tecnología, en concordancia con Tsai (2018) y Pérez et al. (2020), buscaba potenciar la perspectiva sociocrítica y la participación del estudiantado en temas socio-científicos. En la Figura 1 se presenta el mapa de progreso de la SEA.

Desde la ficha 5 (segundo ciclo 5-E) se hace uso de Universe Sandbox, cuyo uso se justifica por permitir simular la gravedad a escala, crear sistemas solares, simular o manipular el clima en los planetas, visualizar eventos históricos a nivel planetario, entre otras funciones que determinaron la practicidad del software.
Fichas de trabajo de la SEA
Las fichas impresas (Figura 2) contuvieron tres tareas cada una. En las sesiones 1 y 2 se desarrollaron las ligadas al ciclo 1 sin software (ficha 1, 2, 3 y 4) y en las sesiones 3 a 6 se desarrolló una ficha por sesión (ficha 5, 6, 7 y 8) correspondiente al ciclo 2 con software. En torno al ciclo de 5-E, la ficha 1 corresponde a la etapa 1E, la ficha 2 a la 2E, la 3 a la 3E y la 4 a la 4E. Se repite el ciclo con la ficha 5 con la etapa 1E, ficha 6 con la 2E, ficha 7 con la 3E y la ficha 8 con la 4E. La etapa 5-E se integra en cada una de las fichas con la tarea 3.

Ficha 1
Su objetivo fue reconocer elementos básicos de la gravedad trabajando los componentes de afirmación y pruebas. La Tarea 1 indagó en las creencias iniciales comparando la caída libre de una manzana y una hoja de papel. En la Tarea 2, el estudiantado formuló y testeó hipótesis para modificar la hoja y alterar su tiempo de caída, registrando las pruebas experimentales. Finalmente, la Tarea 3 (Figura 3) consistió en predecir y justificar el orden de caída de diversos objetos con distinta masa y aerodinámica, apoyándose en videos o experiencia empírica.

Ficha 2
Tuvo por objetivo identificar las variables de la LGU mediante experimentación controlada. La Tarea 1 consistió en asociar variables físicas (masas, distancia, centro de giro) a los componentes de un modelo mecánico (globos llenos de arena o agua unidos por un hilo a través de un tubo de lapicera). En la Tarea 2, los grupos construyeron el artefacto (Figura 4), formularon predicciones sobre su movimiento rotacional y registraron observaciones (pruebas) tras su manipulación. Finalmente, en la Tarea 3, elaboraron una explicación física consensuada del equilibrio dinámico observado. El artefacto se guardó para ser trabajado en la sesión 2.

Ficha 3
En la sesión 2, esta ficha tuvo por objetivo revisar las variables involucradas en la LGU mediante la manipulación de experimentos controlados. La tarea 1 consistió en utilizar pruebas para justificar explicaciones de la ficha 2 desde un video de cómo sería jugar baloncesto en diferentes planetas debido a la diferencia de gravedad sobre sus superficies.
Para la tarea 2, se usó el artefacto creado en la sesión anterior, se hizo modificación a la masa, como colocar más arena a uno de los globos o colocar dos globos en un lado y se modificó el largo de la cuerda. Para cada cambio se hizo funcionar al artefacto igual que en la ficha 2, y se debió explicar los resultados. Luego, en la tarea 3, el estudiantado refutó en grupo una explicación alternativa al fenómeno de la gravitación (Figura 5), la cual poseía errores intencionales.

Ficha 4
Con esta ficha se tuvo por objetivo analizar la interacción gravitacional entre dos planetas. El estudiantado observó un video (accedido por un QR) de una simulación respecto a planetas inventados por Universe Sandbox: Mnus Pan (gaseoso) e Ideascinus (rocoso) que orbitaban uno respecto al otro. Con base en ellos, la primera tarea (Figura 6) solicitó realizar dos afirmaciones sobre los planetas y luego para cada una de ellas, individualmente se escribió una prueba respecto a la observación.

En la tarea 2, se reunieron los grupos de trabajo, revisaron la simulación observada y plantearon una pregunta con su respectiva respuesta, basándose en cuestionamientos surgidos a partir de un video de ambos planetas. La tarea 3 consistió en observar dos simulaciones: la inicial de dos planetas y una nueva con cuatro cuerpos. El estudiantado debió explicar la dinámica de Kepler-303b (simulación 2) en relación con el planeta Ideascinus. Luego se intercambiaron las respuestas entre los integrantes del grupo y refutaron la explicación leída.
Ficha 5
En la tercera sesión (Figura 7), se inició el segundo ciclo de las 5-E haciendo uso del software Universe Sandbox con el objetivo de analizar la interacción gravitacional entre sistemas de planetas. En la tarea 1 se analizó la dinámica de un sistema planetario ficticio, debiendo reconocer lo ocurrido durante cierto lapso.

En la segunda tarea, se comparó la interacción y dinámica de los cuatro planetas del sistema a partir de datos de la simulación. Mientras que en la tarea 3 se analizó el comportamiento del sistema en función de la masa de los planetas y sus distancias a un planeta central.
Ficha 6
La cuarta sesión (Figura 8) tuvo por objetivo analizar la interacción gravitacional entre sistemas de planetas mediante software. Se introdujo el uso del software Universe Sandbox. Para la tarea 1, iniciaron eliminando el Sol del Sistema Solar a través de una simulación e hicieron anotaciones en la ficha con respecto a lo que sucede en la simulación. En la tarea 2 analizaron la importancia del Sol en el Sistema Solar desde el punto de vista de la gravedad. En la tarea 3, los equipos reemplazaron el Sol por la estrella Rigel. Analizaron variaciones de masa y distancia, introduciendo así el concepto de centro de masa (lugar físico de concentración de la masa de un objeto).

Ficha 7
Para la sesión 5, la ficha 7 tuvo por objetivo diseñar un Sistema Solar estable mediante Universe Sandbox. En la Tarea 1, los grupos crearon un sistema (estrella central y cuatro planetas: dos rocosos y dos gaseosos) y elaboraron explicaciones sobre la gravedad en función de masa y distancia de sus componentes. La Tarea 2 implicó modificar variables del sistema y refutar una explicación alternativa dada (Figura 9). Finalmente, la Tarea 3 introdujo la expresión matemática de la LGU (sin definir la constante G); el estudiantado calculó la fuerza gravitatoria en función de G usando datos de la simulación (sin restringir unidades de medida) y refutaron al defender una teoría sobre la interacción.

Ficha 8
El objetivo de la ficha 8 en la última sesión, fue formular la LGU mediante los modelos del sistema solar. La Tarea 1 requirió plantear una hipótesis (afirmación) sobre la modificación de la ecuación para un satélite en órbita de un planeta cualquiera en su sistema solar de la ficha anterior (Figura 9). En la Tarea 2, simularon satélites artificiales para responder interrogantes sobre su dinámica e interacción. Posteriormente, en la Tarea 3, tras la introducción de la ecuación de gravedad superficial de un planeta, calcularon experimentalmente el valor de la constante G utilizando los datos de sus planetas simulados y finalizaron refutando una explicación alternativa sobre la invarianza de dicha constante (Figura 10).

Resultados
Desempeño en el Ciclo 1: Experimentación física y observación (fichas 1 a 4)
En esta fase inicial, el análisis de las producciones escritas (Tabla 2) muestra un desempeño variable ante fenómenos tangibles. En la ficha 1, la intuición permitió que un 52,8% de las respuestas alcanzara el Nivel 2 en la Tarea 1. Por ejemplo, se registraron explicaciones como la de E.37, quien indicó que la manzana cae antes por la fuerza de gravedad que ejerce en base a su masa. Sin embargo, al proponer modificaciones experimentales (Tareas 2 y 3), los argumentos descendieron mayoritariamente al Nivel 1; las respuestas se centraron en soluciones prácticas, sugiriendo tirar la hoja de papel antes (E.15) o arrugarla para formar una bola (E.16), sin integrar una justificación robusta.

Durante las fichas 2 y 3, persistió la dificultad para vincular pruebas con afirmaciones. En la ficha 2 (Tarea 3), el 67,9% de las explicaciones se clasificó en Nivel 0 en razonamiento, por ejemplo, limitándose a narrar que cuando el globo pequeño gira, el grande se queda en la misma distancia (E.50) sin aludir a causas físicas. Hubo mejoras en la ficha 3, donde respuestas como la de E.6 lograron relacionar que, a mayor masa del planeta, este poseía mayor gravedad, aunque carecieron de datos específicos del video para alcanzar el nivel máximo. La ficha 3 resultó con un 54,7% de las respuestas mostrando una refutación de forma insuficiente, mientras que otros mantuvieron dificultades conceptuales, argumentando que “la gravedad actúa como un resorte, empujando y comprimiendo” [E.48].
El ciclo cerró con la ficha 4, mostrando un repunte. En la Tarea 2, se obtuvieron razonamientos de Nivel 2, como el de E.20, quien concluyó que, a mayor interacción gravitatoria, su velocidad aumenta porque la gravedad se ejerce entre ambos planetas. Asimismo, en la refutación de la Tarea 3, argumentos como el de E.39 validaron correctamente explicaciones de sus compañeros basándose en el uso adecuado de “conceptos de masa, órbita y distancia”.
Desempeño en el Ciclo 2: Modelización con Universe Sandbox (fichas 5 a 8)
La incorporación del software marcó una mejora en la calidad de las producciones (Tabla 3). En la ficha 5, el 64,2% de las respuestas logró afirmaciones completas; por ejemplo, E.11 detalló que la órbita del planeta se hizo más cerrada, y por ende rápida, después de acercarse a los otros cuerpos. En la ficha 6, la manipulación de variables permitió razonamientos complejos: al eliminar el Sol, por ejemplo, en el registro de E.2 se describió que los planetas dejaron de seguir órbitas y salieron expulsados en línea recta, comprobando en el software mediante repetición que la velocidad se “mantenía constante”.

La ficha 7 evidenció un salto en la capacidad de conectar variables. Argumentos como el de E.9 explicaron el equilibrio orbital razonando que al colocar los planetas con menos masa más cerca de la estrella la gravedad afectaba en mayor medida haciéndolos orbitar más rápido. Finalmente, en la ficha 8, la calidad de la refutación se mantuvo robusta pese a la complejidad matemática. El 50,9% de las respuestas alcanzó el Nivel 2, ejemplificado por el escrito de E.37, quien refutó la variabilidad de la constante G tras probar con dos planetas con masas distintas, obteniendo valores similares y concluyendo que “G no depende del planeta”.
Progreso del estudiantado en la argumentación científica de la SEA
Afirmación
El análisis de la categoría Afirmación (Figura 11) reveló que, durante el ciclo sin software, el desempeño fue fluctuante: aunque se inició con 28 estudiantes en el Nivel 2, este número descendió drásticamente a 3 en las tareas intermedias con el predominio del Nivel 1 con hasta 53 estudiantes, para luego recuperarse con 25 al final de este ciclo. Por el contrario, la introducción del software marcó una tendencia de mejora sostenida y estable, pues la cantidad de estudiantes en Nivel 2 aumentó progresivamente de 34 a 52 (alcanzando el 98,1% de la muestra al final de la SEA), mientras que el Nivel 1 se redujo al mínimo (1 estudiante) y el Nivel 0 no presentó evidencias.

La progresión en este nivel se evidenció al transitar de afirmaciones basadas en el sentido común hacia la incorporación de variables físicas precisas. El alumnado superó el modelo de gravedad como “caída” al definirla correctamente como una interacción mediada por la masa y la distancia.
En las etapas iniciales, predominaron afirmaciones basadas en intuiciones o concepciones alternativas (Nivel 0); por ejemplo, ante la pregunta sobre la caída libre, un estudiante sostuvo que “la fuerza de gravedad actúa de manera igual sobre la manzana, porque apunta hacia arriba” [E.14], evidenciando un problema conceptual. De igual manera, otro estudiante ofreció soluciones prácticas válidas (Nivel 1) respondiendo que para igualar los tiempos de caída se debería “tirar la hoja de papel antes que la manzana” [E.15]. Por el contrario, en las fases avanzadas con uso de software, las afirmaciones alcanzaron mayor precisión (Nivel 2). Esto se refleja en la siguiente respuesta sobre la modificación de la LGU para satélites en órbita: “La ecuación se debiese modificar, considerando que está muy cerca del planeta, entonces su distancia debiese disminuir, acercándose al radio del planeta” [E.37].
Prueba
El análisis de la categoría Evidencia (Figura 12) mostró que, en la fase sin software, se registró una disminución gradual de respuestas de Nivel 0, de 26 a 4 estudiantes. Durante esta etapa, el Nivel 1 (evidencia apropiada pero insuficiente) funcionó como transición, concentrando a gran parte del grupo (entre 56,6% y 75,5%), mientras paulatinamente aumentaba la proporción de estudiantes que alcanzaban el nivel máximo. Con la introducción del software, el Nivel 0 desapareció por completo. Se observó un cambio desde el Nivel 1 hacia el Nivel 2, caracterizada por respuestas que seleccionaron y utilizaron datos adecuados y suficientes para respaldar las afirmaciones.

En las tareas iniciales, la carencia de sustento empírico fue evidente en respuestas como la del estudiante 5, quien, ante la solicitud de sustentar qué observó al modificar la masa de globos, se limitó a afirmar que “no afecta” [E.5] (Nivel 0). Con el uso de la simulación, la capacidad de extraer datos mejoró sustancialmente. Por ejemplo, E.36 utilizó información explícita de la tabla de datos para justificar la interacción gravitatoria: “La tabla muestra que el planeta Nus Poen tiene mucha más masa y gravedad que Kepler-303b, por lo que es el que más influye en su movimiento” [E.36]. Finalmente, en las etapas de mayor complejidad, el estudiantado logró construir evidencias robustas basadas en la observación dinámica de variables. Un ejemplo destacado es E.40, quien describió con precisión el cambio en las condiciones orbitales: “Al hacer el cambio en el simulador, observamos en el panel de datos que la Tierra comenzó a 1 UA, pero debido a la gran masa de Rigel, esta distancia disminuyó rápidamente en la pantalla hasta llegar a 0 km…” [E.40].
El uso de datos extraídos del software permitió al alumnado abandonar ideas intuitivas para construir pruebas basadas en evidencia cuantitativa. Este cambio facilitó la validación del modelo científico mediante la observación de variaciones de fuerza gravitatoria en tiempo real, superando la descripción meramente cualitativa.
Razonamiento
Al comienzo de la secuencia, de las respuestas que abarcaron el componente de razonamiento (Figura 13), el 67,9% fueron clasificadas en el Nivel 0, limitándose a describir observaciones sin establecer vínculos lógicos, y solo un estudiante logró alcanzar el Nivel 2. En las tareas sin software, hubo una reducción del Nivel 0 (que descendió del 67,9% al 3,8%), mientras que el Nivel 1 funcionó como una zona de consolidación, manteniéndose estable entre 30 y 33 estudiantes. El Nivel 2 mostró un crecimiento, alcanzando un 39,6% al final de esta etapa. La introducción de Universe Sandbox marcó un cambio en la profundidad de los argumentos. En esta fase, el Nivel 0 desapareció y se registró un aumento en respuestas de Nivel 2, que llegó a su punto máximo en la penúltima tarea con un 92,2% de estudiantes elaborando razonamientos completos. Sin embargo, es relevante notar una inversión de la tendencia en la tarea final de la secuencia (cálculo de la constante G), donde con la abstracción matemática se provocó que la mayoría (77,4%) de respuestas regresaran al Nivel 1, con razonamientos correctos pero incompletos.

Los razonamientos mostraron una sofisticación al conectar las pruebas con leyes físicas, superando explicaciones básicas. Los estudiantes lograron justificar la estabilidad orbital no como una ausencia de gravedad, sino como un equilibrio, demostrando una evolución significativa hacia el modelo escolar de campo gravitatorio propuesto por Harlen (2015).
Inicialmente, hubo respuestas que reflejaron un nivel bajo, limitándose a narrar lo observado sin aludir a principios físicos. Por ejemplo: “cuando el (globo) pequeño gira, el (globo) grande se queda en la misma distancia, en cambio, cuando el grande gira el pequeño se mueve...” [E.50] (Nivel 0). Con el avance de la secuencia, comenzaron a emerger razonamientos que vinculaban variables causales, como el estudiante 25, quien relacionó la masa con la atracción: “Esto sucede porque... Rigel tiene mucha más masa que el Sol. Al tener tanta masa, hace que la Tierra deje de girar igual y se vaya directo hacia la estrella...” [E.25]. Finalmente, en las etapas avanzadas, se lograron explicaciones más sofisticadas, como la del estudiante 7, quien integró conceptos de inercia y fuerza gravitatoria para explicar la estabilidad orbital: “Esto ocurre porque el planeta necesita una alta velocidad para mantenerse en órbita y no caer debido al fuerte tirón gravitatorio” [E.7].
Refutación
En la Figura 14 se aprecia que, durante las tareas sin uso de software, cerca de la mitad de las respuestas de los estudiantes (49,05%) se mantuvo en el Nivel 0, presentando dificultad en contraargumentar ideas erróneas, mientras que el Nivel 1 mostró un leve descenso sin lograr transferirse al Nivel 2, el cual fue casi inexistente en esta etapa (solo 2 estudiantes). La implementación de Universe Sandbox revirtió esta tendencia negativa, pues en la segunda fase, el Nivel 0 desapareció casi por completo, permitiendo que el Nivel 2 creciera desde 29 hasta alcanzar un máximo de 42 estudiantes (79,2%). Si bien en la tarea final parte de las respuestas regresaron al Nivel 1, el avance global fue favorable para respuestas que entregaran explicaciones alternativas con fundamentos.

Esta evolución se aprecia al analizar la calidad de los contraargumentos. Por ejemplo, el estudiante 2, en etapas iniciales, al intentar desacreditar una explicación alternativa, terminó validando la misma idea errónea que debía combatir: “Está mal ya que la gravedad actúa como un resorte...” [E.2] (Nivel 0). Con el uso del software, la refutación comenzó a anclarse en datos observables. El estudiante 10 logró desmantelar la hipótesis de un par utilizando la evidencia visual de la simulación: “La explicación de mi compañera está mal... en la simulación se vio que Kepler estaba girando... no alejándose en línea recta” [E.10] (Nivel 2). Finalmente, en los niveles más altos de desempeño, el estudiantado logró entregar respuestas que integraron evidencia empírica con principios teóricos abstractos. Esto se refleja en la respuesta del estudiante 22, quien refutó una teoría sobre la medición de distancias apelando tanto a la observación en el software como al concepto físico subyacente: “La teoría 1 es incorrecta porque... vimos que la línea... empezaba justo en el puntito del centro... Esto es así porque la gravedad funciona atrayendo hacia el centro de masa...” [E.22] (Nivel 2).
Esta dimensión permitió visibilizar la superación de modelos iniciales, como la “gravedad dependiente del aire”. Al interactuar con el vacío simulado, el estudiantado pudo invalidar sus propias concepciones alternativas, utilizando el software como herramienta para demostrar la universalidad de la interacción gravitatoria.
Discusiones
El análisis de la implementación revela que el estudiantado comenzó mostrando dificultades en los componentes de prueba, razonamiento y, especialmente, refutación. Esto es coherente con la literatura que define la argumentación científica como una competencia epistémica compleja que requiere evaluar conocimientos frente a pruebas (Jiménez-Aleixandre, 2010). El desafío cognitivo inicial llevaba a los estudiantes enfrentarse a la abstracción de la LGU y a la necesidad de coordinar sus modelos mentales iniciales con datos empíricos para construir una justificación sólida (Osborne, 2010), proceso que se vio facilitado por la estructura explícita del marco CERR.
Un hallazgo central fue la evolución de las explicaciones del estudiantado. La dificultad inicial para elaborar refutaciones (Nivel 0 predominante en la primera etapa) sugiere que los estudiantes operaban desde modelos intuitivos arraigados. Sin embargo, la exigencia de contraargumentar dentro de la SEA actuó como un motor de cambio, obligando a revisar y refinar estos modelos iniciales para alinearlos progresivamente con las Grandes Ideas de la Ciencia (Harlen, 2015).
El punto de cambio en el desarrollo de la estructura argumentativa, evidenciado por el aumento de respuestas de Nivel 2 tras la introducción de Universe Sandbox, plantea el rol de la tecnología en la educación científica. Más allá de la visualización, el software operó como un entorno de indagación que permitió la generación autónoma de pruebas empíricas virtuales. Tal como plantean Pallant y Lee (2015) y De Jong et al. (2013), al manipular variables y observar consecuencias inmediatas en el sistema simulado, el estudiantado pudo aislar relaciones causales (causa-efecto) que sirvieron de sustento para sus afirmaciones. Esto permitió superar la barrera de la abstracción matemática, dando a los argumentos una base empírica que no estaba presente en la fase sin software.
La confrontación de modelos iniciales con evidencia virtual permitió que el estudiantado abandonara la idea de la gravedad como un “resorte físico” [E.48] para entenderla como una relación de proporcionalidad entre masa y distancia, visualizada en tiempo real mediante el software.
Luego, la consolidación de los niveles de razonamiento hacia el final de la secuencia sugiere que la integración de la práctica argumentativa (McNeill y Krajcik, 2008) con herramientas de modelización computacional favorece un aprendizaje profundo. La ausencia de clasificación de respuestas en los niveles más bajos al finalizar la intervención indica que el andamiaje tecnológico y metodológico fue favorable para que los estudiantes se apropiaran de modelos científicos más robustos, necesarios para una ciudadanía competente.
Conclusiones
Esta investigación evaluó el desarrollo de la argumentación científica en estudiantes de secundaria al aprender sobre la LGU mediante una SEA mediada por Universe Sandbox. El análisis de las respuestas permite concluir que la intervención generó una mejora en la estructura argumentativa del estudiantado, validando el enfoque mixto del diseño.
Respecto a la primera pregunta de investigación sobre el desarrollo de la estructura argumentativa, se evidenció una progresión desde afirmaciones basadas en intuiciones hacia argumentos fundamentados en el modelo científico escolar. La práctica de justificar afirmaciones con pruebas y razonamiento permitió que respuestas entregadas por el estudiantado transitaran desde niveles de desempeño incipientes hacia niveles avanzados, demostrando una mayor capacidad para coordinar teoría y evidencia, la cual es una competencia clave para la alfabetización científica (Osborne y Allchin, 2024). Específicamente, la capacidad de refutar que inicialmente fue la más deficiente, experimentó un crecimiento, lo que indicaría una mayor sofisticación en la evaluación crítica del conocimiento manifestado en las respuestas de los estudiantes.
En cuanto a la segunda interrogante sobre la contribución del software, se concluye que Universe Sandbox jugó un rol epistémico fundamental. La diferencia en los resultados entre los ciclos sin y con software respalda que la simulación digital es un potencial en la educación científica para visualizar fenómenos abstractos y fomentar el aprendizaje activo (Kefalis et al., 2025), obteniéndose pruebas virtuales que de otro modo serían inaccesibles. El software facilitó la ilustración de conceptos y permitió que los estudiantes construyeron y validaron sus Grandes Ideas sobre la gravedad, mediante la modelización de fenómenos complejos.
Por lo que este estudio aporta evidencia de que la integración articulada de la argumentación científica (marco CERR) y la tecnología educativa (simulaciones) es una estrategia potente para la enseñanza de la física. En síntesis, la SEA demuestra que la simulación no solo ilustra fenómenos, sino que actúa como un andamiaje epistémico que permite al estudiante transitar de modelos escolares fragmentados a modelos científicos sofisticados. Esta integración metodológica ofrece una ruta replicable para abordar otros conceptos abstractos de la Física.
Se sugiere que futuras investigaciones exploren la transferencia de esta competencia argumentativa a otros tópicos científicos y analicen cómo estos entornos virtuales pueden seguir contribuyendo a la evolución de los modelos mentales del estudiantado en el largo plazo.
Agradecimientos
A Dra. Claudia Reyes, por aportar en el diseño y propuestas de actividades base para la secuencia, y a Mg. Nicolás Fernández, por guiar la investigación base. ANID/Doctorado Nacional 21241378
Referencias
Ageitos, N., Puig, B. y Calvo Peña, X. (2017). Trabajar genética y enfermedades en secundaria integrando la modelización y la argumentación científica. Revista Eureka sobre Enseñanza y Divulgación de las Ciencias, 14(1), 86-97. https://doi.org/10.25267/Rev_Eureka_ensen_divulg_cienc.2017.v14.i1.07
Bybee, R. (2015). The BSCS 5E instructional model. Creating teachable moments. National Science Teachers Association.
Creswell, J. y Plano-Clark, V. (2018). Designing and conducting mixed methods research (3rd ed.). SAGE Publications.
De Jong, T., Linn, M. y Zacharia, Z. (2013). Physical and virtual laboratories in science and engineering education. Science, 340(6130), 305-308. https://doi.org/10.1126/science.1230579
Develaki, M. (2012). Integrating Scientific Methods and Knowledge into the Teaching of Newton’s Theory of Gravitation: An Instructional Sequence for Teachers’ and Students’ Nature of Science Education. Science and Education, 21(1), 853–879. https://doi.org/10.1007/s11191-010-9243-1
Erduran, S. y Park, W. (2023). Argumentation in physics education research: Recent trends and key themes. En M. Taşar, y P. Heron (Eds.), The International Handbook of Physics Education Research: Learning Physics. AIP Publishing. https://doi.org/10.1063/9780735425477_016
Galicia, L., Balderrama, J. y Edel, R. (2017). Validez de contenido por juicio de expertos: propuesta de una herramienta virtual. Apertura, 9(2), 42-53. http://dx.doi.org/10.32870/Ap.v9n2.993
Galili, I., Bar, V. y Brosh, Y. (2017). Teaching Weight-Gravity and Gravitation in Middle School. Testing a New Instructional Approach. Science and Education, 25(1), 977–1010. https://doi.org/10.1007/s11191-016-9865-z
Harlen, W. (Ed.). (2015). Trabajando con las grandes ideas de la educación en ciencias. INNOVEC.
Jiménez-Aleixandre, M. (2010). 10 ideas clave: Competencias en argumentación y uso de pruebas. Graó.
Juita, Z., Sundari, P., Sari, S. y Rahim, F. (2023). Identification of Physics Misconceptions Using Five-tier Diagnostic Test: Newton’s Law of Gravitation Context. Journal Penelitian Pendidikan IPA, 9(8), 5954–5963. https://doi.org/10.29303/jppipa.v9i8.3147
Kavanagh, C., y Sneider, C. (2006). Learning about Gravity II. Trajectories and Orbits: A Guide for Teachers and Curriculum Developers. Astronomy Education Review, 5(2), 21-52. https://doi.org/10.3847/AER2006018
Kefalis, C., Skordoulis, C. y Drigas, A. (2025). Digital Simulations in STEM Education: Insights from Recent Empirical Studies, a Systematic Review. Encyclopedia, 5(1), 10. https://doi.org/10.3390/encyclopedia5010010
Krajcik, J. y McNeill, K. (2015). Designing and assessing scientific explanation tasks. En R. Gunstone (Ed.). Encyclopedia of science education, 1(1), 285-290. https://doi.org/10.1007/978-94-007-2150-0
Liou, J. y Johnson, N. (2006). Risks in space from orbiting debris. Science, 311(5759), 340-341. https://doi.org/10.1126/science.1121337
McNeill, K. L. y Krajcik, J. (2008). Scientific explanations: Characterizing and evaluating the effects of teachers' instructional practices on student learning. Journal of Research in Science Teaching, 45(1), 53–78. https://doi.org/10.1002/tea.20201
McNeill, K. y Martin, D. (2011). Claims, evidence, and reasoning. Science and Children, 48(8), 52-56.
Métioui, A. y Trudel, L. (2021). Children and Preservice Teachersʼ Misconceptions and Scientifically Acceptable Conceptions about Movement, Force, and Gravity. Modern Perspectives in Language, Literature and Education, 5(1), 26-42. https://doi.org/10.9734/bpi/mplle/v5/9032D
Ministerio de Educación de Chile [MINEDUC]. (2018). Texto del estudiante: Física 2° medio. SM.
Ministerio de Educación de Chile [MINEDUC]. (2021). Ciencias Naturales Física 1° y 2° medio: Texto del estudiante. Malva.
Oliva, J. (2019). Distintas acepciones para la idea de modelización en la enseñanza de las ciencias. Enseñanza De Las Ciencias. Revista de investigación y experiencias didácticas, 37(2), 5–24. https://doi.org/10.5565/rev/ensciencias.2648
Osborne, J. (2010). Arguing to Learn in Science: The Role of Collaborative, Critical Discourse. Science, 328(5977), 463-466. https://doi.org/10.1126/science.1183944
Osborne, J. y Allchin, D. (2024). Science literacy in the twenty-first century: informed trust and the competent outsider. International Journal of Science Education, 46(7), 847-864. https://doi.org/10.1080/09500693.2024.2331980
Pallant, A. y Lee, H. (2015). Constructing Scientific Arguments Using Evidence from Dynamic Computational Climate Models. Journal of Science Education and Technology, 24(3), 378–395. https://doi.org/10.1007/s10956-014-9499-3
Pérez, S., Ríos, C. y Castillo, J. (2020). Realidad Aumentada y simuladores: astronomía para niños y niñas de cinco años. ALTERIDAD. Revista de Educación, 15(1), 25-35. https://doi.org/10.17163/alt.v15n1.2020.02
Samosa, R. (2021). Effectiveness of claim, evidence and reasoning as an innovation to develop student’s scientific argumentative writing skills. Galaxy International Interdisciplinary Research Journal, 9(5), 135-150. https://doi.org/10.17605/OSF.IO/2PBWU
Teixeira, E., Freire, O. y Greca, I. (2015). La enseñanza de la gravitación universal de Newton orientada por la historia y la filosofía de la ciencia: una propuesta didáctica con un enfoque en la argumentación. Enseñanza de las Ciencias, 33(1), 205-223. https://doi.org/10.5565/rev/ensciencias.1226
Toledo, W., Sánchez, M., Árcega, A., Navarrete, A. y Samperio, G. (2020). Diseño de un entorno virtual para el aprendizaje de la Ley de Gravitación de Newton en Física básica. Pädi Boletín Científico de Ciencias Básicas e Ingenierías del ICBI, 7(14), 18-22. https://doi.org/10.29057/icbi.v7i14.4461
Tsai, C. (2018). The effect of online argumentation of socio-scientific issues on students' scientific competencies and sustainability attitudes. Computers & Education, 116(1), 14-27. https://doi.org/10.1016/j.compedu.2017.08.009
Viau, J. y Moro, L. (2013). El perfil epistemológico de Bachelard y los modelos didácticos: la transferencia epistemológica en alumnos de nivel medio. Cuadernos de educación, 9(9). 153-164.
Young, H. y Freedman, R. (Eds.). (2018). Física Universitaria con Física Moderna 1. Pearson.
Información adicional
Para citar este artículo: Varas, D. y Ramírez, B. (2026). Desarrollo de la argumentación científica con Universe Sandbox en la enseñanza de la gravitación. Revista Eureka sobre Enseñanza y Divulgación de las Ciencias, 23(1), 1803. https://doi.org/10.25267/Rev_Eureka_ensen_divulg_cienc.2026.v23.i1.1803
Declaración de autoría : D. V.: Conceptualización; Gestión de datos; Análisis formal; Investigación; Metodología; Administración del proyecto; Recursos; Software; Supervisión; Validación; Visualización; Redacción - borrador original. B. R.: Validación; Visualización; Redacción - borrador original; Redacción - revisión y edición.
Declaración responsable de uso de herramientas de Inteligencia Artificial : Para el proceso de la investigación y escritura, no se han usado herramientas de Inteligencia Artificial, sí para revisión de ortografía y corrección de estilo posteriores.
Información adicional
redalyc-journal-id: 920