Resumen: La enseñanza de la probabilidad ha tomado un papel importante y necesario en la formación de los estudiantes, puesto que en la cotidianidad se presentan situaciones en las cuales es fundamental entender afirmaciones probabilísticas, o bien, calcular la probabilidad de eventos para la toma de decisiones. El presente estudio tiene por objetivo evaluar el manejo de tablas de contingencia 2x2, respecto al cálculo de probabilidades, por 25 estudiantes chilenos de primer año medio (14-15 años), antes y después de una experiencia de aprendizaje. El estudio es de tipo cualitativo, descriptivo-exploratorio, donde se describen y comparan las respuestas de los participantes en seis ítems relacionados con el cálculo de probabilidades simples, conjuntas y condicionales. En general, los resultados indican una mejora en el cálculo de probabilidades por parte de los participantes, mediante el uso de la regla de Laplace y la regla de tres como estrategias de solución; sin embargo, persisten algunos conflictos semióticos, por ejemplo, la confusión entre una probabilidad conjunta con una condicional, o viceversa, después de la experiencia de aprendizaje.
Palabras clave: Cálculo de probabilidades, tablas de doble entrada, experiencia de aprendizaje, Educación Media, probabilidad.
Abstract: The teaching of probability has taken on an important and necessary role in the education of students, since in everyday life situations arise in which it is essential to understand probabilistic statements, or to calculate the probability of events for decision making. The present study aims to evaluate the use of 2x2 contingency tables, with respect to the calculation of probabilities by 25 Chilean first year high school students (14-15 years old), before and after a learning experience. The study is of a qualitative, descriptive-exploratory type, where the answers of the participants to six items related to the calculation of simple, joint, and conditional probabilities are described and compared. In general, the results indicate an improvement in the calculation of probabilities by the participants, through the use of Laplace's rule and the rule of three as solution strategies; however, some semiotic conflicts persist, for example, the confusion between a joint probability and a conditional one, or vice versa, after the learning experience.
Keywords: Probability computation, two-ways tables, learning experience, Secondary Education, probability.
Investigación
Cálculo de probabilidades en tablas de contingencia por estudiantes chilenos de primer año medio
Calculation of probabilities in contingency tables by Chilean firstyear high school students
Recepción: 20 Junio 2021
Recibido del documento revisado: 05 Noviembre 2021
Aprobación: 17 Enero 2022
La probabilidad tiene relevancia en todos los ámbitos de la vida, desde situaciones simples (por ejemplo, la probabilidad de obtener cara o sello al lanzar una moneda) hasta complicadas (por ejemplo, la probabilidad que existe de salvar a un paciente si se realiza uno u otro procedimiento médico); es decir, forma parte de los eventos que involucran la aleatoriedad y que se encuentran en el mundo donde vivimos. Esto implica un papel importante de la probabilidad en la formación de futuros ciudadanos, Gal (2005) señala la necesidad de fomentar una cultura probabilística en los estudiantes, volviéndolos capaces de hacer frente a situaciones cotidianas donde se presenten eventos aleatorios y fenómenos del azar, y con ello, tomar decisiones fundamentadas en la interpretación de la información probabilística involucrada (por ejemplo: inversión en la bolsa de valores, apuestas, entre otros). De acuerdo con Gal (2005, p. 46), uno de los elementos de conocimiento que sustentan la base para una cultura probabilística corresponde al “cálculo de probabilidades: formas para encontrar o estimar la probabilidad de eventos”. En ese sentido, los estudiantes deben estar familiarizados con las formas de encontrar la probabilidad de eventos para: 1) comprender las declaraciones probabilísticas hechas por otros, 2) generar estimaciones sobre la probabilidad de eventos y comunicarse con otros sobre ellas, y 3) tomar decisiones basadas en dicha probabilidad. Para esto, los enfoques clásico y frecuencial son útiles, siendo promovidos para el cálculo o la estimación de probabilidades (Sánchez, 2009) e incluidos en los currículos de matemáticas de diversos países como España, México y Chile (Batanero, 2016). En Chile, la probabilidad es abordada desde tercer año de educación básica, con la idea de posibilidad (Ministerio de Educación [MINEDUC], 2012).
Con respecto a las tablas de contingencia, diversos autores (Cañadas et al., 2017; Fernández et al., 2021) señalan que son un instrumento de gran utilidad en la presentación y análisis de datos cualitativos, así como en la búsqueda de una correlación entre dichos datos; por tanto, este tipo de tablas son utilizadas con gran frecuencia en actividades profesionales. Sin embargo, a pesar de su relevancia, el aprendizaje sobre tablas de contingencia no está libre de confusiones y dificultades, que inclusive perseveran posterior a la enseñanza (Batanero et al., 1997). Entre las tareas relacionadas con tablas de contingencia se encuentra el cálculo de probabilidades simples, conjuntas y condicionales, que pueden ser confundidas por los estudiantes; por ejemplo, la falacia de la condicional traspuesta o confusión de la inversa, que consiste en la confusión entre las dos direcciones de la probabilidad condicional, es decir, confundir P(A/B) con P(B/A) (Falk, 1986). Según Cañadas (2012), de estas tres probabilidades, la condicional es la de mayor complejidad.
Respecto a las tablas de contingencia en el currículo de Estadística y Probabilidad de educación secundaria, Cañadas et al. (2016) y Awuah y Ogbonnaya (2020) expresan que posee una estrecha relación con los contenidos que presenta; por ejemplo, la idea de eventos dependientes e independientes, frecuencia, muestra, la probabilidad de distintos eventos, los principios de la probabilidad, el razonamiento crítico y la resolución de problemas. En Chile, en lo que corresponde a la educación media, la tabla de contingencia y el cálculo de probabilidades se trabajan de manera conjunta en primer año medio. En la Tabla 1 se presentan los objetivos de aprendizaje (OA) relacionados, de manera explica o implícita, con estos contenidos.
Dada la importancia del cálculo de probabilidades, como elemento de conocimiento de la cultura probabilística, y de las tablas de contingencia, como representación estadística de gran utilidad para el análisis de datos cualitativos, nos planteamos como objetivo: evaluar el manejo de tablas de contingencia, respecto al cálculo de probabilidades (simples, conjuntas y condicionales), por parte de estudiantes chilenos de primer año medio, antes y después de una experiencia de aprendizaje. Esto nos permitirá no solo evaluar y evidenciar la efectividad de la experiencia presentada, sino que también aportar con datos respecto a los conflictos que exhiben estudiantes de educación media y los desafíos que se presentan dentro del currículo para el efectivo manejo de las tablas de doble entrada en el cálculo de probabilidades en Chile y Latinoamérica.
Para el desarrollo de este estudio se utilizan algunas de las nociones del modelo teórico denominado Enfoque Ontosemiótico del Conocimiento y la Instrucción Matemáticos (EOS), desarrollado por Godino y sus colaboradores (Godino et al., 2007; 2020). Este modelo reconoce una doble naturaleza de las matemáticas: como sistema de objetos y como sistema de prácticas. Una práctica matemática se asume como “toda actuación o expresión (verbal, gráfica, etc.) realizada por alguien para resolver problemas matemáticos, comunicar a otros la solución obtenida, validarla o generalizarla a otros contextos y problemas” (Godino y Batanero, 1994, p. 334); mientras que un objeto matemático se refiere a cualquier entidad material o inmaterial que interviene en la práctica matemática, apoyando y regulando su realización (Font et al., 2013).
Según Font et al. (2007), en las prácticas matemáticas se presentan múltiples funciones semióticas (correlación entre expresión y contenido), debido a la necesidad de usar y operar con objetos matemáticos. Estas funciones juegan un rol esencial en la comprensión de los objetos matemáticos (Godino, 2003), ya que permiten a los sujetos tener diferentes perspectivas de un mismo objeto y, con esto, obtener una mejor comprensión de este. Otra de las nociones teóricas utilizadas en este estudio es el conflicto semiótico, de acuerdo con Godino et al. (2007, p. 133), “es cualquier disparidad o diferencia de interpretación entre los significados atribuidos a una expresión por dos sujetos (personas o instituciones)”. Bajo esta perspectiva, en este estudio asumimos que, si las interpretaciones realizadas por el estudiante durante el aprendizaje del cálculo de probabilidades en tablas de contingencia 2x2 no son las esperadas por el profesor, entonces se produce un conflicto semiótico.
La tabla de contingencia es un cuadro estructurado por filas y columnas, que tiene como propósito resumir información acerca de dos variables estadísticas y representar la distribución conjunta de ambas variables (Gea et al., 2020). Esto permite no solo el registro de los datos, sino que también el estudio de la relación entre las variables involucradas (generalmente cualitativas); por ejemplo, los datos obtenidos en una encuesta (esencial en trabajos sociológicos) y los resultados de una prueba para detectar enfermedades (esencial en la medicina) (López-Roldán y Fachelli, 2015).
Este tipo de tabla es considerada como un objeto semiótico complejo, ya que en ella subyacen varios conceptos implícitos y sus interrelaciones (Cañadas, Batanero et al., 2013; Gea et al., 2020), cuya forma más simple es cuando las variables poseen sólo dos categorías (Estrada y Díaz, 2007). En la Tabla 2 se muestra la estructura general de una tabla de contingencia 2x2.
A partir de una tabla de doble entrada, se derivan tres tipos de frecuencias absolutas, mismas que relacionaremos con la que se muestra en la Tabla 2:
1- Frecuencias absolutas marginales. Estas corresponden a las cantidades en la fila inferior y en la columna derecha; por tanto, pueden ser por columnas (a+c y b+d) o por filas (a+b y c+d).
2- Frecuencias absolutas dobles. Estas corresponden a las cantidades de las cuatro celdas centrales (a, b, c y d) y nos indican la frecuencia en la que se presentan intersecciones específicas de valores de las variables.
3- Frecuencias absolutas condicionales. Estas corresponden a la frecuencia para un valor de una variable dejando fijo un valor de la otra. Matemáticamente, estas frecuencias absolutas condicionales son iguales a las dobles; sin embargo, la condicional no se percibe psicológicamente de la misma manera, debido a que su lectura es con relación a un valor fijo de la condición indicada (la cantidad total de la que forma parte no es el misma), lo que resulta más complicado de identificar e interpretar (Cañadas, 2012; Gea et al., 2020). Esta diferencia en lectura se identifica de mejor manera al estudiar las frecuencias relativas, pues es muy distinto leer “de a+b+c+d, a cumple con AB” que leer “de a+c, a cumple con B”; no es difícil observar que ambas lecturas hacen referencia a una misma frecuencia, pero la primera lo hace con respecto al total y la intersección de categorías, mientras que la segunda corresponde a la lectura de una categoría sobre otra.
A partir de las frecuencias absolutas, se pueden determinar las frecuencias relativas dobles, marginales y condicionales. Ahora bien, con el supuesto de equiprobabilidad de todos los casos, al preguntarnos por la probabilidad de obtener un sujeto al azar de la muestra, podemos calcular probabilidades para cada una de las frecuencias relativas mencionadas, no coincidiendo las frecuencias relativas dobles y relativas condicionales (Estrada y Díaz, 2007; Gea et al., 2020).
En concreto, nuestro estudio se enfoca en el análisis de las prácticas matemáticas realizadas por los estudiantes de primer año medio para trabajar el cálculo de probabilidades en tablas de contingencia, considerando su forma más simple (2x2), así como en la identificación de las estrategias resolutivas y los conflictos semióticos.
Cañadas, Batanero et al. (2013) diseñan una secuencia didáctica para la comprensión de las tablas de contingencia en estudiantes de primer año de Psicología. Esta secuencia consistió en la lectura e interpretación de tablas de contingencia, en particular, resumir datos, identificar frecuencias dobles, calcular y representar las frecuencias relativas dobles, marginales y condicionales e interpretarlas, y calcular las probabilidades simples, compuestas y condicionales. Lo anterior es esencial para reconocer la asociación estadística, identificar la dependencia, analizar la diferencia entre las frecuencias observadas y las esperadas en caso de independencia, y utilizar medidas de asociación. Este trabajo sigue una línea de investigación (Cañadas, Contreras et al., 2013; Cañadas et al., 2011) que considera a la tabla de contingencia como un objeto semiótico complejo. Además, indican que muchas personas forman teorías propias respecto a la relación de variables, generando sesgos y concepciones erróneas, y que las estrategias utilizadas en la infancia pueden mantenerse a lo largo de la vida adulta; lo anterior provoca dificultades que deben subsanarse para formar ciudadanos que comprendan las tablas de contingencia y puedan utilizarlas para su beneficio.
En Batanero et al. (2015) se propone una actividad didáctica para trabajar con estudiantes de Educación Secundaria Obligatoria, en la que se aborda: la interpretación de tablas de contingencia, frecuencias dobles, marginales y condicionales; el cálculo de probabilidades a partir de datos representados en la tabla; la representación de los datos mediante un diagrama de barras adosadas y un gráfico de mosaicos; la introducción intuitiva de las ideas de asociación e independencia; y la adquisición de algunos procedimientos sencillos para valorar estas últimas ideas. La actividad propuesta consistió en una situación contextualizada, a partir del uso de datos relacionados con el hundimiento del Titanic. En concreto, se les solicito a los estudiantes calcular probabilidades simples, conjuntas y condicionales en forma de porcentajes, y con ello, analizar si existía dependencia entre el sexo de la persona y si fue salvada, con tal de verificar si se hizo caso de la “norma moral” (salvar primero a niños y mujeres), a partir del uso del diagrama de árbol y otras representaciones gráficas, con el propósito de fomentar el razonamiento estadístico y crítico.
Con base en estos estudios, podemos rescatar que es esencial que el estudiante sea capaz de leer e interpretar adecuadamente las tablas de contingencia para que comprenda la información y, con ello, calcule probabilidades a partir de los datos, reconozca el tipo de relación entre dos variables comparando las frecuencias condicionales, analice las posibles explicaciones de una asociación estadística, entre otros, y con ello, a partir de la enseñanza, supere dificultades y sesgos como la falacia de la condicional transpuesta.
La mayoría de las investigaciones sobre cálculo de probabilidades en tablas de contingencia se han realizado con psicólogos en formación y futuros profesores de matemáticas, es decir, con estudiantes de mayor nivel académico que los que participan en este estudio. Por ejemplo, Díaz y De la Fuente (2005) analizan las dificultades que presentan 154 futuros psicólogos al calcular probabilidades en tablas de doble entrada. Sus resultados señalan que el 75% de los participantes calcula correctamente la probabilidad simple, mientras que apenas el 50% calcula la probabilidad condicional y la compuesta. Entre las dificultades encontradas, los futuros psicólogos confunden un suceso con su complementario y la probabilidad con casos favorables.
Por su parte, Estrada y Díaz (2006) analizan los conflictos semióticos que presentan 65 profesores en formación en el cálculo de probabilidades en una tabla de doble entrada. Los resultados evidencian un alto porcentaje (aproximadamente el 75%) de respuestas correctas en el caso de la probabilidad simple y alrededor del 50% en la probabilidad conjunta y condicional. Sin embargo, se presentan conflictos semióticos al confundir una probabilidad condicional con su inversa, confundir la probabilidad condicional con la conjunta y confundir entre un suceso y su complemento, así como un porcentaje considerable (alrededor del 25%) de participantes que no contestan las distintas tareas propuestas. En un estudio similar, Estrada y Díaz (2007) analizan los conflictos semióticos que exhiben 117 futuros profesores (estudiantes de diversas especialidades de diplomaturas de magisterio) al calcular probabilidades en tablas de doble entrada. Los resultados obtenidos en este estudio son semejantes con los del anterior, alrededor de un 40% comete errores en el cálculo de la probabilidad conjunta y condicional, siendo el conflicto predominante la confusión entre estas, y una alta cantidad estudiantes no entregan respuesta (entre un 20% y 30%, dependiendo de la tarea), lo cual se puede atribuir al desconocimiento o falta de comprensión sobre las ideas que la tarea puso a prueba.
Complementando el trabajo de Estrada y Díaz (2006), Contreras et al. (2010) analizan las respuestas de 69 futuros profesores de primaria con respecto al cálculo de probabilidades (simple, compuesta y condicional) en tablas de doble entrada, sin haber recibido instrucción previa sobre el contenido. A diferencia de los resultados del estudio mencionado, se presenta un bajo porcentaje (alrededor del 26%) de respuestas correctas, y una proporción mayor (aproximadamente el 35%) de estudiantes que no aportaron soluciones a las probabilidades solicitadas. Entre los conflictos semióticos reportados, se destaca la confusión de la condicional con su inversa; además, al igual que en otras investigaciones, se recalca la necesidad de preparación, por parte del profesorado, para abordar estos contenidos de manera efectiva. En Cañadas et al. (2017) se evalúa la competencia con respecto al cálculo de probabilidades y juicios de asociación de 94 estudiantes españoles de psicología que habían cursado una asignatura de estadística en la que se abordó el tema de probabilidad. Los resultados de este estudio evidencian que la mayoría de los participantes (59,6%) entregan la respuesta correcta con respecto a la pregunta de probabilidad condicional, debido a que la enseñanza impartida fue productiva en los estudiantes. Un estudio distinto es el realizado por Contreras et al. (2013), quienes analizan las definiciones proporcionadas por 196 futuros profesores de matemáticas de secundaria de la probabilidad simple y condicional. De acuerdo con los resultados, se observa una escasa competencia de los sujetos de estudio para entregar las definiciones de manera correcta (15,9%), por mencionar, presentan errores en la definición al añadir condiciones innecesarias.
Un acercamiento a estudiantes de secundaria se observa en el trabajo de Batanero et al. (1996), quienes estudian las estrategias intuitivas y preconcepciones sobre la asociación de variables de tablas de contingencia (2x2, 2x3 y 3x3) por estudiantes de secundaria (17-18 años) de tres escuelas distintas. Estos autores sintetizan ideas de investigaciones anteriores, por ejemplo, que suele presentarse un conflicto cognitivo cuando los datos no coinciden con las expectaciones y que la percepción de covariación depende de la fuerza relativa de las fuentes de información; e identifican que la mayoría de los estudiantes realizan un juicio incorrecto o cometen errores al justificar un juicio correcto. Además, identifican estrategias correctas, parcialmente correctas e incorrectas, utilizadas por los estudiantes; las primeras consisten en el uso de las distribuciones condicionales, las segundas en la comparación de casos (a favor y en contra) de cada variable y las últimas consisten en concepciones erróneas de la asociación (determinista, unidireccional y local).
A partir de estas investigaciones, se exhibe que psicólogos en formación y futuros profesores presentan conflictos semióticos al calcular probabilidades simples, conjuntas y condicionales, a partir de datos representados en tablas de contingencia, y cómo las intervenciones didácticas y la enseñanza adecuada son una buena forma de evitarlos y corregirlos. Además, se sugiere que los estudiantes de secundaria no son ajenos a estos conflictos, presentando juicios o estrategias incorrectas en el uso de tablas de contingencia.
Con tal de aportar a esta corriente investigativa, nos enfocamos en identificar las estrategias y los conflictos semióticos que estudiantes chilenos de Educación Media presentan en el cálculo de probabilidades en tablas de contingencia 2x2, esencial para la resolución de tareas que involucran este tipo de representación de datos, comparando su evolución después de una experiencia de aprendizaje.
Seguimos una metodología de tipo cualitativa (Pérez-Serrano, 1994), de nivel descriptiva-exploratoria (Hernández et al., 2010), centrada en describir y comparar las respuestas de estudiantes chilenos de primer año medio a ítems relacionados con el cálculo de probabilidades (simple, conjunta y condicional) en tablas de contingencia 2x2, antes y después de una experiencia de aprendizaje. Para esto, nuestro estudio estuvo organizado en cinco etapas: 1) generación del instrumento, 2) aplicación previa, 3) experimento de enseñanza, 4) aplicación posterior, y 5) análisis de resultados; que se describen a continuación.
La muestra de estudiantes fue no aleatoria (con selección intencionada) y estuvo formada por un grupo de 25 estudiantes chilenos que cursaban primer año de Educación Media de un colegio particular subvencionado de la cuidad de Osorno, Chile. Las edades de estos estudiantes oscilaban entre los 14 y 15 años, siendo 44% mujeres y 56% hombres. Estos participantes fueron seleccionados intencionalmente bajo el criterio de no haber recibido algún tipo de enseñanza sobre el tema de cálculo de probabilidades en tablas de contingencia 2x2 al momento de iniciar el estudio. Es posible que hayan estudiado temas de probabilidad (por ejemplo, probabilidad de un evento compuesto), dado que se prescriben en las bases curriculares de niveles anteriores (MINEDUC, 2015), sin embargo, no se recogió evidencia para afirmarlo. La profesora titular de la asignatura de matemáticas dirigió el desarrollo de las actividades propuestas por el libro de texto de primer año medio (Galasso et al., 2016), y uno de los autores colaboró con la aplicación de los instrumentos, adoptando un carácter de tipo observador al evitar involucrarse en los procesos de solución.
Se elaboró un cuestionario con dos problemas contextualizados, cada uno de ellos con tres ítems relacionados con el cálculo de probabilidades en tablas de contingencia 2x2. El problema 1 (ver Figura 1) se adaptó del propuesto por Estepa (1993) y presenta la relación entre dos variables dicotómicas (“Fuma” o “No fuma” y “Tiene molestias respiratorias” o “No tiene molestias respiratorias”). El seleccionar una persona al azar consiste en un fenómeno compuesto por dos experimentos aleatorios: el primero con dos resultados posibles: “Tiene molestias respiratorias” (evento A) y su complemento, “No tiene molestias respiratorias” (A’); y el segundo con otros dos resultados: “Fuma” (evento B) y su complemento, “No fuma” (B’).
El problema 2 (ver Figura 2), es una adaptación del propuesto por Contreras et al. (2010), y muestra la relación entre dos variables dicotómicas (“Chico” o “Chica” y “Le gusta el ping-pong” o “No le gusta el ping-pong”). Asimismo, al seleccionar una persona al azar se realiza un experimento aleatorio compuesto por dos más simples: el primero con dos resultados posibles: “Ser chico” (evento A) y su complemento, “Ser chica” (A’); y el segundo con otros dos resultados: “Le gusta el ping-pong” (evento B) y su complemento, “No le gusta el ping-pong”
(B’).
Los ítems de cada problema están relacionados con el cálculo de probabilidades:
Ítem 1. Cálculo de la probabilidad de un evento simple (probabilidad simple).
Ítem 2. Cálculo de la probabilidad de la conjunción de dos eventos (probabilidad conjunta).
Ítem 3. Cálculo de la probabilidad de que ocurra un evento, sabiendo que ha ocurrido otro evento (probabilidad condicional).
Con la finalidad de evaluar la pertinencia de los enunciados de los problemas y los ítems, se realizó la validación del cuestionario por el método de juicio de expertos y aplicación piloto (Balestrini, 2006).
Para nuestro estudio, decidimos aplicar el cuestionario en dos momentos. La primera aplicación del cuestionario (aplicación previa) se realizó antes de llevarse a cabo una experiencia de aprendizaje, esto con el objetivo de explorar las estrategias y conflictos semióticos previos de los estudiantes sobre el cálculo de probabilidades en tablas de contingencia 2x2. La profesora titular de la asignatura de matemáticas, con apoyo de uno de los autores, presentó a los estudiantes el cuestionario y solicitó la lectura de las instrucciones en forma grupal, permitiendo expresar algunos comentarios para una mayor comprensión acerca de lo que iban a realizar. Después de la experiencia de aprendizaje, se aplicó nuevamente el cuestionario (aplicación posterior) con el objetivo de explorar el avance en el tipo de respuestas de los estudiantes. La aplicación de cada uno de los cuestionarios tuvo una duración de 45 minutos, aproximadamente.
Steffe y Thompson (2000) señalan que un experimento de enseñanza implica una secuencia de episodios de enseñanza en la que participan, comúnmente, un investigador-docente, uno o más estudiantes y uno o más investigadores-observadores. Para llevar a cabo un experimento de enseñanza, según Cobb y Gravemeijer (2008), es necesario desarrollar tres fases: 1) preparación del experimento, 2) experimentación para promover el aprendizaje, y 3) ejecución del análisis retrospectivo de los datos. De acuerdo con Molina et al. (2011, pp. 7-8), en la segunda fase se presentan “las intervenciones en el aula y las sucesivas iteraciones del ciclo de tres pasos: 1) diseño y formulación de hipótesis; 2) intervención en el aula y recogida de datos; y 3) análisis de los datos y revisión y reformulación de hipótesis”. En este estudio consideramos cada una de las fases mencionadas con tal de formar parte del aprendizaje de los estudiantes de la manera más completa posible, las cuales se presentan de manera explícita en los siguientes párrafos.
Fase 1. Preparación del experimento. Se realizó una revisión bibliográfica de investigaciones sobre el cálculo de probabilidades en tablas de contingencia, con el propósito de identificar potenciales conflictos semióticos al abordar este tipo de tareas. Además, se analizaron las actividades vinculadas al estudio de la estadística y probabilidad propuestas en el libro de texto chileno de primer año medio (Galasso et al., 2016), con el objetivo de identificar el tipo de tareas relacionadas con nuestro tema de estudio. Seguidamente, se diseñó, validó y aplicó un cuestionario (presentado en la sección 4.2) para explorar las estrategias y conflictos semióticos previos de los estudiantes sobre el cálculo de probabilidades en tablas de contingencia. Con base en los resultados del análisis anterior, se diseñó una experiencia de aprendizaje para desarrollar los OA12, OA13 y OA14, referentes al contenido de tablas de contingencia y cálculo de probabilidades (MINEDUC, 2016), y abordar los conflictos semióticos identificados.
Fase 2. Experimentación. Esta fase, experiencia de aprendizaje, estuvo a cargo de la profesora titular de la asignatura de matemáticas. El primer paso, diseño y formulación de hipótesis, consistió en un trabajo previo por parte de la profesora. Inicialmente, mediante un análisis del currículo chileno y las investigaciones anteriormente mencionadas, y tomando como referente las nociones mencionadas en el EOS, la profesora organizó el contenido en un orden ascendente de complejidad: primero, presentó la situación-problema en la que interviene una tabla de contingencia, seguido de las ideas necesarias para un acercamiento a su solución, los conceptos y definiciones para abordar el cálculo de las distintas probabilidades, y finalmente, las prácticas que, articulando las nociones anteriores, permiten el análisis y solución del problema planteado, así como su representación. El segundo paso, intervención en el aula y recogida de datos, fue organizado en cinco clases de dos horas pedagógicas (90 minutos por clase) y una clase de 45 minutos, descritas a continuación:
1 Clase 1: La profesora presenta el OA12 y OA13. Primero, exhibe un mapa conceptual con el propósito de aclarar la utilización de las distintas representaciones (nube de puntos y tablas de contingencia) dependiendo de las variables a analizar. Después, presenta los conceptos de nube de puntos, relación lineal y punto aislado, sus definiciones, y muestra ejemplos en la pizarra, graficando características de cada uno de ellos. Finalmente, los estudiantes desarrollan ejercicios en la pizarra, relacionados con lo expuesto en la clase. Esta clase se enfocó en la comprensión de la relación entre dos variables y su representación en nube de puntos y tablas de contingencia, y corresponde a un primer acercamiento de los estudiantes a estas representaciones de datos, abordando cómo y cuándo se utilizan para registrarlos, así como las nociones probabilísticas esenciales para las tareas de mayor complejidad, en particular, la de relación lineal.
2. Clase 2: La profesora presenta el OA12 y OA14. Inicialmente, define y aborda los conceptos de tabla de contingencia y Regla de Laplace para el cálculo de probabilidades. Seguidamente, realiza un ejemplo en la pizarra en el que se solicita completar una tabla de contingencia a partir de la información proporcionada en una tabla de frecuencias; para ello, la profesora señala que es necesario identificar las variables que están relacionadas. Además, solicita a los estudiantes calcular probabilidades simples, conjuntas y condicionales en tablas de contingencia, mediante la regla de Laplace y, con ello, proporcionar conclusiones. Finalmente, los estudiantes resuelven ejercicios relacionados con lo expuesto en la clase en sus cuadernos. Esta clase se centró en la comprensión del cálculo de probabilidades en tablas de contingencia, en particular, la probabilidad simple, conjunta y condicional.
3. Clase 3 y 4: El propósito de estas dos clases fue que los estudiantes resuelvan ejercicios relacionados con nubes de puntos y tablas de contingencia. En concreto, desarrollaron actividades donde se solicita: 1) comparar poblaciones utilizando nube de puntos, 2) registrar las distribuciones de dos características distintas en una tabla de contingencia, y 3) calcular probabilidades (simples, conjuntas y condicionales) en tablas de contingencia utilizando la regla de Laplace. La profesora adoptó, mayoritariamente, un carácter de tipo observador, involucrándose con los estudiantes solamente cuando estos presentaban dificultades en algún ejercicio. Estas clases se centraron en la resolución de problemas.
4. Clase 5: Esta clase estuvo enfocada en la interpretación de datos representados en nubes de puntos y tablas de contingencia, así como en el cálculo de probabilidades; esto con el propósito de fomentar la lectura e interpretación de este tipo de representaciones estadísticas, así como una cultura probabilística en los estudiantes.
5. Clase 6: Aplicación del cuestionario (aplicación posterior).
El tercer paso, análisis de los datos y revisión y reformulación de hipótesis, se realizó periódicamente, es decir, al finalizar cada una de las clases, excepto la última. En concreto, la profesora recolectó las respuestas dadas por los estudiantes a diversas tareas pertenecientes a la experiencia de aprendizaje. Esto le permitió identificar conflictos semióticos dentro del proceso de aprendizaje de los estudiantes, de tal manera que pudo realizar reajustes dentro de su diseño y reafirmar o refutar hipótesis previas respecto a la comprensión de la información y cálculo de probabilidades en tablas de contingencia.
Fase 3. Análisis Retrospectivo de los Datos. En esta fase se recopiló y organizó el conjunto de datos. Además, se realizó un análisis comparativo de las respuestas de los estudiantes, antes y después de la experiencia de aprendizaje.
Recogidos los datos, se analizaron mediante un proceso cíclico y la triangulación de expertos, clasificando los tipos de respuesta de cada ítem en cuatro categorías:
1. Correctas: en la que se agrupan aquellas respuestas que presentan el valor de la probabilidad solicitada, junto con la explicación aritmética (procedimiento) y/o deductiva.
2. Parcialmente correcta: cuando la respuesta presenta el valor de la probabilidad solicitada, pero no la justifica con explicaciones aritméticas y/o deductivas, o bien, proporciona una respuesta distinta a la esperada debido únicamente a errores de cálculo.
3. Incorrectas: cuando la respuesta es errada y se muestran confusiones entre probabilidades, o bien, se proporcionan probabilidades intuitivas o subjetivas (Batanero, 2005).
4. Sin respuesta: cuando el ítem no es abordado y se deja el espacio de la respuesta en blanco.
A continuación, se presenta la respuesta y práctica esperada (institucionalmente correctas), algunas de las respuestas recolectadas por la aplicación previa y posterior del instrumento, y la clasificación de estas como correctas, parcialmente correctas e incorrectas, para cada uno de los ítems de los problemas. Para facilitar el análisis y la presentación de los datos, designamos a cada estudiante el código Ex, donde x corresponde a un número del 1 al 25 de acuerdo con el orden en que se han analizado las respuestas.
En el ítem 1 de cada problema se esperaba que los estudiantes calcularan la probabilidad de un evento simple (probabilidad simple), a partir de la regla de Laplace o el cálculo de la frecuencia relativa marginal por fila, haciendo uso del algoritmo (a+b)/(a+b+c+d): a) problema 1, P(Fumar) = (180+40)/(180+40+20+160) = 220/400 = 0,55; y b) problema 2, P(Le gusta el ping-pong) = (80+40)/(80+40+40+20) = 120/180 = 0,66. En la Tabla 3 se muestra la clasificación de algunas respuestas, junto a su justificación.
En seguida, en la Tabla 4 se resumen los resultados del análisis de las respuestas de los estudiantes al ítem 1 de cada problema, por etapa y categorías señaladas.
El análisis de los resultados nos permitió observar que, antes de la experiencia de aprendizaje, una gran cantidad de las respuestas se clasifican como incorrectas o sin respuesta (P1: 64%, P2: 64%), siendo los conflictos de mayor frecuencia: a) confusión con casos favorables (P1: 32%, P2: 16%), y b) probabilidad bajo el enfoque subjetivo (P1: 8%, P2: 16%). Esto refleja que una mayoría de los estudiantes confunden la probabilidad con el número de casos o aún poseen concepciones incorrectas sobre ella, por ejemplo, el sesgo de probabilidad subjetiva o la probabilidad intuitiva. Por otro lado, en las respuestas correctas se destaca el uso de la regla de tres como estrategia de solución (P1: 20%, P2: 16%), es decir, los estudiantes calculan el porcentaje desde los casos favorables con respecto al total que consideran el 100%. Esto refleja una preferencia a la práctica menos relacionada con los significados de la probabilidad, esperable debido a que los participantes no han abordado la probabilidad en tablas de doble entrada.
Después de la experiencia de aprendizaje, se observa un aumento en el número de respuestas correctas; la regla de Laplace corresponde a la nueva práctica (estrategia) dominante en ellas, pasando a un más de 50% en ambos problemas (P1: 72%, P2: 64%).
Además, se observa la disminución de participantes que usan la regla de tres y la ausencia de conflictos como confusión con casos favorables; esto refleja que la experiencia de enseñanza fue útil en solucionar conflictos semióticos respecto a la lectura de una frecuencia simple, en especial, con aquellos que no entregaban respuesta o confundían la probabilidad con un valor de la tabla. Sin embargo, no existe mejora en conflictos semióticos asociados a concepciones erróneas de la probabilidad, en particular, el de la probabilidad subjetiva e intuitiva, lo que sugiere que presentar prácticas y ejemplos de su lectura y cálculo, en situaciones contextuales, no es suficiente para que los estudiantes superen sus sesgos.
En relación con el ítem 2 de cada problema, se esperaba que los estudiantes calcularan la probabilidad de la conjunción de dos eventos (probabilidad conjunta), a partir de la regla de Laplace o el cálculo de la frecuencia relativa doble, haciendo uso del algoritmo (b)/(a+b+c+d): a) problema 1, P(Fumar y No tener molestias respiratorias) = (40)/(180+40+20+160) = 40/400 = 0,1; y b) problema 2, P(Chica y Le gusta el ping-pong) = (40)/(80+40+40+20) = 40/180 = 0,22. En la Tabla 5 se presentan algunas respuestas clasificadas según las categorías antes señaladas, junto con una breve explicación sobre su clasificación.
En la Tabla 6, se presenta un resumen de los resultados del análisis de las respuestas de los estudiantes al ítem 2 de cada problema, por etapa y categorías señaladas.
Al igual que en ítem 1, antes de la experiencia de aprendizaje, la mayoría de las respuestas se clasifican como incorrectas o sin respuesta (P1: 60%, P2: 64%), siendo los conflictos de mayor presencia: a) confusión con casos favorables (P1: 12%), b) probabilidad bajo el enfoque subjetivo (P2: 20%), y c) probabilidad bajo el enfoque intuitivo (P1: 16%), además se destaca el uso de la regla de tres como estrategia de solución (P1: 16%, P2: 16%). Estos resultados reflejan que, antes de una experiencia de aprendizaje, los estudiantes presentan dificultades para el estudio de la probabilidad conjunta en tablas de contingencia, vinculadas respecto a nociones incorrectas de probabilidad (confusión con casos favorables y los sesgos subjetivos e intuitivos).
De manera similar al ítem anterior, después de la experiencia de aprendizaje, se observa un aumento considerable en el número respuestas correctas (52% en ambos problemas), en su mayoría haciendo uso de la regla de Laplace; además, no existe una mayor diferencia en el número de confusiones, sesgos probabilísticos (probabilidad subjetiva e intuitiva) y participantes que no responden. En concreto, a pesar de que hay un cambio positivo en el número de respuestas correctas, existe una diferencia menor en comparación con en el ítem 1; es decir, nuestros resultados indican que el cálculo de probabilidades conjuntas en tablas de contingencia es una tarea más difícil de abordar que el cálculo de probabilidades simples.
Con respecto al ítem 3 de cada problema se esperaba que los estudiantes calcularan la probabilidad de que ocurra un evento, sabiendo que ha ocurrido otro evento (probabilidad condicional), a partir de la regla de Laplace o el cálculo de la frecuencia relativa condicional por columna, haciendo uso del algoritmo (b)/(b+d): a) problema 1, P(Fumar/No tiene molestias respiratorias) = (40)/(40+160) = 40/200 = 0,2; y b) problema 2, P(Le gusta el ping-pong/ Chica) = (40)/(40+20) = 40/60 = 0,66. En la Tabla 7 se muestran algunas respuestas clasificadas de acuerdo con las categorías antes señaladas, junto con una breve explicación sobre su clasificación.
A continuación, en la Tabla 8 se resumen los resultados del análisis de las respuestas de los estudiantes al ítem 3 de cada problema, por etapa y categorías señaladas.
Con respecto al análisis de los resultados del ítem 3, antes de la experiencia de aprendizaje, la mayoría de las respuestas se clasifican como incorrectas o sin respuesta (P1: 72%, P2: 64%), siendo los conflictos de mayor presencia: a) probabilidad bajo el enfoque subjetivo (P1: 20%, P2: 20%), y b) probabilidad bajo el enfoque intuitivo (P1: 8%). Esto sugiere que, frente a tareas del cálculo de probabilidad condicional, los estudiantes presentan mayores conflictos que frente a los otros ítems. Respecto a las respuestas correctas, no existe un predominio claro de la estrategia utilizada, probablemente porque su resolución correcta requiere de una mayor comprensión de las ideas probabilísticas asociadas y, por ende, es más difícil que se calcule directamente con la regla de tres, misma razón por la cual no es extraño que este tipo de problemas tenga la mayor cantidad de participantes sin responder.
Después de la experiencia de aprendizaje, se visualiza un aumento considerable en el número respuestas correctas (haciendo uso de la regla de Laplace), y una disminución en el porcentaje de las categorías incorrectas. Sin embargo, no hubo mejora en la cantidad de estudiantes que no responde el ítem, lo que sugiere que una sola experiencia de aprendizaje no es suficiente para desarrollar la noción de probabilidad condicional en los estudiantes, más aún cuando dicha experiencia es general y no está únicamente enfocada en la condicional.
En nuestra sociedad actual, es indiscutible que el estudiante debe poseer ciertas capacidades ligadas a una adecuada cultura probabilística; es decir, un conocimiento básico de conceptos probabilísticos, como el cálculo de probabilidades, que le permitan tomar decisiones acertadas en situaciones de incertidumbre. Bajo esta perspectiva, en este estudio se presentan los resultados del análisis de las estrategias de solución y los conflictos semióticos de estudiantes chilenos de primer año medio en el cálculo de probabilidades, simple, conjunta y condicional, en tablas de contingencia 2x2, antes y después de una experiencia de aprendizaje.
Antes de la experiencia de aprendizaje, pocos estudiantes tenían nociones acerca de cómo calcular probabilidades en tablas de contingencia 2x2, a partir de uso de estrategias de solución como la regla de tres (mayoritariamente), la regla de Laplace, y en algunos casos, la proporcionalidad, es decir, a partir de la relación entre los datos presentes en la tabla. Estos resultados son similares a los obtenidos en trabajos previos como los de Díaz y De la Fuente (2005), Estrada y Díaz (2006, 2007) y Contreras et al. (2010), quienes identifican conflictos no menores en el cálculo de probabilidades de profesionales en formación (psicólogos y/o profesores), y sugieren que, si no son resueltas, este tipo de dificultades se puede mantener a lo largo del proceso educativo, la educación superior y la vida profesional. Además, una gran cantidad de las respuestas dadas por los estudiantes en esta etapa presentan algún conflicto semiótico, por ejemplo, confundir la probabilidad solicitada (ya sea simple, conjunta o condicional) con el número de casos favorables; de forma similar, se presenta un número considerable de respuestas que manifiestan el enfoque subjetivo o intuitivo de la probabilidad y pueden relacionarse con las concepciones erróneas mencionadas por Batanero et al. (1996). Finalmente, el predominio de la regla de tres refleja un temprano manejo de ideas probabilísticas por parte de los estudiantes, al ser la práctica menos asociada a los significados de la probabilidad (Batanero, 2005); mientras que el predominio de conflictos asociados a concepciones erróneas de la probabilidad (subjetivo e intuitivo) en los ítem 2 y 3, que involucra el cálculo de la probabilidad compuesta y condicional, nos permite concluir que es más probable que un estudiante se aferre a estas concepciones erróneas cuando la tarea es más compleja.
Después de la experiencia de aprendizaje, principalmente en el ítem 1 e ítem 2, observamos una considerable mejora en el número de respuestas correctas y que la mayoría de los estudiantes hacen uso del algoritmo de la regla de Laplace para el cálculo de probabilidades, disminuyendo el uso de otras prácticas resolutivas. Lo que refleja que los estudiantes, mediante una experiencia de aprendizaje, pueden adoptar efectivamente el uso de la regla de Laplace para el cálculo de probabilidades. Sin embargo, las concepciones erróneas de la probabilidad (enfoque subjetivo o intuitivo) no se pueden resolver con la experiencia presentada, ya que requieren que el estudiante reconstruya su significado de probabilidad, especialmente en ítems de mayor complejidad (probabilidad compuesta y condicional) que también dificultan resolver problemas como la confusión entre una probabilidad conjunta con una condicional. Además de sugerir que los estudiantes prefieren el uso de la regla de Laplace, una vez abordado el concepto mediante una experiencia de aprendizaje, los resultados obtenidos concuerdan con Cañadas et al. (2017), quienes evidencian la efectividad de una intervención didáctica o un proceso de aprendizaje adecuado para resolver o evitar los conflictos mencionados anteriormente, facilitando a los estudiantes el manejo de tablas de contingencia para el cálculo de probabilidades.
Nuestro estudio señala que el cálculo de probabilidades en tablas de contingencia 2x2 resulta comprensible para los estudiantes de primer año medio, aun cuando no se abordó de manera formal la probabilidad condicional. Por ello, esta experiencia de aprendizaje permitió a los estudiantes desarrollar su capacidad para calcular probabilidades simples, conjuntas y condicionales, con base en los datos presentados en este tipo de tablas estadísticas. Consideramos que los resultados han sido positivos, los estudiantes logran utilizar la regla de Laplace como estrategia de solución y disminuyeron los conflictos semióticos; lo que invita a extender esta experiencia con otros grupos de estudiantes y también profundizar en los conflictos que no se lograron resolver con la experiencia presentada, algunos de los cuales van más allá del uso de tablas de contingencia (ejemplo, la probabilidad subjetiva), y que corresponden a potenciales desafíos dentro del currículo chileno y latinoamericano para el efectivo manejo de este tipo de tablas y de las probabilidades.
Esta investigación contó con el financiamiento de la Dirección de Investigación de la Universidad de Los Lagos, Chile, por medio de la Beca de Finalización de Tesis de Pre y Postgrado, Concurso 2020.
*Correspondencia: Daniela Calderón Torres. Correo electrónico: danieladelpilar.calderon2@alumnos.ulagos.cl.