Artículo

UN ANÁLISIS EPISTEMOLÓGICO HISTÓRICO DEL PARÁMETRO Y SU INFLUENCIA EN LA ENSEÑANZA DE LA ESTADÍSTICA

A HISTORIC EPISTEMOLOGICAL ANALYSIS OF THE PARAMETER AND ITS INFLUENCE ON TEACHING STATISTICS

UMA ANÁLISE EPISTEMOLÓGICA HISTÓRICA DO PARÂMETRO E SUA INFLUÊNCIA NO ENSINO DE ESTATÍSTICA

Alvaro Cortínez Pontoni
Universidad de Tarapacá,, Chile
Blanca Rosa Ruiz Hernández
Tecnológico de Monterrey, México
José Armando Albert Huerta
ecnológico de Monterrey, México

UN ANÁLISIS EPISTEMOLÓGICO HISTÓRICO DEL PARÁMETRO Y SU INFLUENCIA EN LA ENSEÑANZA DE LA ESTADÍSTICA

Interciencia, vol. 45, núm. 5, pp. 216-222, 2020

Asociación Interciencia

Recepción: 10 Enero 2019

Aprobación: 08 Mayo 2020

Resumen: Uno de los elementos que son transversales a lo largo de la estadística es el parámetro. Se estudia junto a las variables aleatorias, donde surge como un elemento generalizador de los modelos de probabilidad. A continuación, gran parte de la inferencia estadística es realizada en función del parámetro, donde es estimado, se le asigna distribución a priori en estadística bayesiana, se le realizan pruebas de hipótesis, es utilizado para comparar poblaciones y para estimar modelos de regresión, entre otros. Por todo lo anterior, el parámetro requiere una formulación propia en estadística. Un parámetro estadístico no es lo mismo que un parámetro matemático. En este artículo el parámetro es analizado desde el punto de vista epistemológico, buscando la caracterización que tiene dentro de la matemática y, también, dentro de la estadística. Se estudia el parámetro en el contexto de la enseñanza de la matemática y se espera darle el lugar que merece dentro de la enseñanza estadística.

Palabras clave: Didáctica de la Estadística, Epistemología del Parámetro, Parámetro Estadístico.

Abstract: One of the elements that are of a transversal nature throughout statistics is the parameter. It is studied together with random variables, where it emerges as a generalizing element of probability models. Thereafter, a large part of the statistical inference is carried out according to the parameter, where it is estimated, assigned a priori distributions in Bayesian statistics, hypotheses testings are made, and it is used to compare populations and to estimate regression models, among others. For these reasons, the parameter requires its own statistical formulation. A statistical parameter is not the same as a mathematical parameter. The parameter is discussed in this paper from the epistemological point of view, seeking the characterization it has in mathematics, as well as in statistics. The parameter will be discussed in the context of the teaching of mathematics and it is expexted to be assigned a rightful place within statistical education.

Resumo: Um dos elementos que são transversais ao longo da estatística é o parâmetro. Estuda-se junto às variáveis aleatórias, onde surge como um elemento generalizador dos modelos de probabilidade. A seguir, grande parte da inferência estatística é realizada em função do parâmetro, onde é estimado, se lhe atribui distribuição a priori em estatística bayesiana, se lhe realizam provas de hipóteses, é utilizado para comparar populações e para estimar modelos de regreção, entre outros. Por todo o anterior, o parâmetro requer uma formulação própria em estatística. Um parâmetro estatístico não é o mesmo que um parâmetro matemático. Analisar-se-á neste artigo, o parâmetro desde o ponto de vista epistemológico, procurando a caracterização que dentro da matemática tem e, também dentro da estatística. Estudar-se-á o parâmetro no contexto do ensino da matemática e espera-se dar-lhe o lugar que merece dentro do ensino estatístico.

En la actualidad, en la mayoría de las áreas de estudio se enseña al menos un curso de estadística. En general, los contenidos son similares, diferenciándose básicamente en los enfoques y aplicaciones. Sin embargo, sigue siendo común que los estudiantes presenten serias dificultades para entender lo que se enseña en estadística. Dichas dificultades pueden depender del área en que se estudia, de la metodología utilizada por los profesores para impartir las asignaturas, del grado de preparación o madurez que los estudiantes tengan o, incluso, de los objetos que se están enseñando.

Las interpretaciones erróneas son muy comunes a lo largo de los temas de un curso de estadística. Lem et al. (2013) resaltan que las interpretaciones de los gráficos, especialmente el histograma y el diagrama de caja, no son fáciles para los estudiantes. En probabilidades se pueden identificar algunas concepciones erróneas en Ang y Shahrill (2014). No abundan estudios respecto a las interpretaciones (erróneas y no érroneas) que puedan haber en torno al concepto del parámetro. Éste es tomado de la matemática, en funciones y resoluciones de ecuaciones y tratado en estadística como un elemento más, siendo que luego se transforma en el objeto de estudio, especialmente en la estadística inferencial. Cortínez et al. (2015) se realiza un estudio experimental con estudiantes de segundo año de carrera; a pesar de que los autores pusieron especial atención al trato del parámetro en clases, las respuestas obtenidas por los estudiantes siguen siendo muy ambiguas y suelen apuntar al parámetro como una característica de la población, a veces fijo y a veces aleatorio.

En el presente artículo se analiza el parámetro desde un punto de vista epistemológico e histórico. Se revisa su desarrollo en la matemática y estadística. Una vez establecida su conceptualización matemática, se estudia si las propiedades son extendibles a la estadística. Se propone una caracterización propia del parámetro para la estadística, en base al uso que en esta disciplina tiene y, sobretodo, el peso que adquiere en el transcurso de los diferentes temas de un curso de estadística, partiendo desde la ‘transparencia’ hasta ser el ‘objeto de estudio’.

El Concepto de Parámetro

No existe abundante bibliografía centrada específicamente en el parámetro. De hecho, su desarrollo histórico está ligado desde sus principios al de la variable. Según Drijver (2003), es posible distinguir tres fases del desarrollo histórico de las variables: la retórica, la abreviada y la simbólica. En la fase de álgebra retórica (hasta ~250 DC) se utilizaban las palabras completas, sin abreviaciones ni símbolos, por lo que los problemas y sus soluciones se expresaban en el lenguaje natural. En la fase abreviada o sincopada (hasta el siglo XVI) se introdujeron abreviaciones y notaciones, además de símbolos literales para representar incógnitas. Se trataron inicialmente problemas en los que el número de incógnitas es igual al número de ecuaciones y luego sistemas con más variables que ecuaciones. Al tener infinitas soluciones, estas eran expresadas de forma compacta. Este fue el comienzo del uso de los parámetros. Finalmente, en la fase del álgebra simbólica (desde el siglo XVI), los parámetros son considerados ‘constantes cambiantes’, que cambian a un nivel superior al de las variables ‘ordinarias’. De esta forma se pueden hacer generalizaciones de funciones y soluciones algebraicas para ecuaciones paramétricas. Se comenzaron a usar las letras del comienzo del alfabeto para los valores dados (parámetros) y las del final para las cantidades desconocidas (variables).

Es de interés mencionar que la idea de parámetro estadístico ya había sido introducida de forma implícita en la época moderna, sin mencionarlo, en las Memorias sobre las Probabilidades por Laplace (1781). Este autor hacía distinción entre dos situaciones: el cálculo de la probabilidad que se busca y la influencia de sucesos pasados sobre la probabilidad de ocurrencia de sucesos futuros, y explicaba la situación con un ejemplo. Es aquí donde aparece la generalización: el ejemplo consiste en dos jugadores que se enfrentan y se intenta determinar la probabilidad de que el primero gane los primeros n juegos. Da la respuesta en función de si el primer jugador es el más fuerte o el más débil, respectivamente.

Es decir, esa probabilidad dependerá de una cantidad desconocida α. De hecho, Laplace analiza esta cantidad en función de los valores que puede tomar. Además, la trata como variable aleatoria, asegurándose que ∫dαψ(α)=1, donde ψ(α) representa la probabilidad de α. Laplace entrega, además, varios ejemplos más basados siempre en una generalización de un caso particular.

Poco más de un siglo después, William Gosset, más conocido como Student, hablaba de los parámetros como constantes de la población: "…cualquier serie de experimentos solo tiene valor si nos permite hacernos una idea de las constantes estadísticas de la población a la que pertenecen los experimentos" (Student, 1908: 1). Y más adelante: "El método usual para determinar la probabilidad de que la media de la población está dentro de una distancia dada de la media de la muestra es suponer una distribución normal para la media muestral con una desviación estándar igual a s/√n…". Una afirmación muy interesante que hace Gosset es que las distribuciones de las constantes estadísticas de las muestras rápidamente se acercan al Gaussiano cuando las muestras crecen. Es decir, utilizando el lenguaje estadístico moderno, las distribuciones de los estadísticos tienen a un modelo ‘normal’. El autor no hace, por lo tanto, una distinción entre las constantes de las muestras y las de las distribuciones. Ambas se aproximan, sí, a medida que los tamaños muestrales crecen.

Otro de los ‘padres’ de la estadística moderna, Ronald Fisher, ya se refiere directamente al parámetro. No lo define, pero deja clara su posición. Afirma: "…los problemas de estimación surgen cuando conocemos o suponemos la forma de la distribución de frecuencias de la población como una función matemática formada por uno o más parámetros, y queremos estimar los valores de esos parámetros por medio de los registros observacionales disponibles" (Fisher, 1925: 16). Continúa más adelante refiriéndose al estadístico como una función de las observaciones, designándolo como un estimador de cualquiera de esos parámetros. Y concluye que un estadístico, para tener alguna utilidad, tiene que tender hacia algún valor fijo a medida que el número de la muestra aumenta. Fisher da, por lo tanto, una idea de que el parámetro caracteriza al modelo que representa una distribución de frecuencias; lo considera fijo y desconocido. Es decir, Fisher entrega una formalización del parámetro antes incluso de que haya sido estudiado más a fondo. Además, en su famoso trabajo de 1925, Theory of Statistical Estimation, puede observarse que el parámetro surge de la idea de darle una forma funcional al histograma.

Nótese que en la estadística subjetivista el parámetro es una pieza clave, al punto que los estudios se hacen en torno a él, asignándosele una distribución de probabilidades y estudiando su evolución. Bernardo y Smith (2000) le asignan una gran importancia al concepto de parámetro: “¡Es necesario hacer una advertencia inicial! Las distribuciones son la estructura básica de los modelos estadísticos y se definen habitualmente en términos de los parámetros. El rol y la interpretación de modelos y parámetros dentro de contexto general subjetivista, son extremadamente importantes. De momento, los parámetros pueden ser vistos como 'etiquetas' de las diferentes funciones matemáticas que se puedan considerar, mientras que los 'parámetros etiquetados' están relacionados con una u otra característica de la población.” (Bernardo y Smith, 2000: 114)

Hoy en día, según Drijver (2003), ya hay conformidad en considerar el origen del parámetro en las ecuaciones matemáticas con la intención de generalizar resultados o generalizar funciones. Es así como dichas ecuaciones tienen dos tipos de variables: las que se refieren al problema mismo y cuyo valor se desea conocer para ciertas especificaciones, y las variables que generalizan resultados, es decir los parámetros. Por lo tanto, un parámetro puede ser considerado esencialmente una variable con características propias. De hecho, las discusiones acerca del concepto de variable pueden aplicarse parcialmente al de parámetro. Como la variable, el parámetro puede jugar diferentes papeles y tener diferentes significados. Como con las variables, tratar esos papeles de forma adecuada es complicado, sobretodo porque esos roles se mantienen implícitos y pueden cambiar durante el proceso de resolución de problemas. Aparte de lo mencionado, ambos conceptos son diferentes.

Para poder establecer el papel del parámetro podemos considerar los siguientes tres aspectos: el nivel superior al que actúan la variación y la generalización, la posición jerárquica del parámetro respecto a la variable, y la complejidad de los diferentes símbolos literales y sus roles.

La variación y generalización utilizando variables ordinarias concierne a la generalización sobre las relaciones aritméticas; la variación y la generalización del parámetro se refiere a la generalización sobre las relaciones algebraicas. Esto lleva a esperar la reificación de expresiones algebraicas con una variable y fórmulas que contienen dos variables.

El tercer aspecto acerca del concepto de parámetro proviene del hecho de que el uso de un parámetro, una ‘letra adicional’, complica el papel de los diferentes símbolos literales que están involucrados. Esto está relacionado con la estereotipificación de las variables literales (Bills, 2001). Se refiere a las convenciones que existen para clarificar el papel de los símbolos literales. Sin embargo, estereotipar puede dificultar la flexibilidad de cambiar el papel de un símbolo literal, por ejemplo para dar a un parámetro el rol de desconocido, como argumenta Bloedy-Vinner (1994: 89): "El significado de una letra como un parámetro o como un incógnita o variable, puede cambiar a lo largo del proceso de resolución de un problema".

Como resultado de este análisis se identifican dos dificultades conceptuales principales. La primera es la dificultad de entender el papel del parámetro, que puede cambiar durante el proceso de resolución del problema. La segunda es la relación jerárquica entre las variables ‘ordinarias’ y el parámetro, especialmente cuando este último no es un marcador de posición para un valor constante.

Se pueden identificar los siguientes roles jerárquicos del parámetro:

--El parámetro como un marcador de posición. El parámetro es visto como una posición, un lugar vacío en el cual se pueden insertar valores numéricos desde el cual pueden también extraerse. El valor en la ‘caja vacía’ es un valor fijo, conocido o desconocido. El objetivo no es encontrar el valor desconocido.

--El parámetro como una cantidad cambiante. El parámetro sigue representando una cantidad numérica. Sin embargo, hay una variación sistemática de ese valor y el parámetro adquiere un carácter dinámico: es un ‘parámetro deslizante’ que suavemente se mueve a través del conjunto de referencia.

--El parámetro como un generalizador. El parámetro se usa para generalizar sobre clases de situaciones, de casos concretos, de expresiones, fórmulas y soluciones. Al hacer esto, la ‘familia paramétrica’ (Giessen, 2002) representa a esas clases y las unifica. El parámetro ya no es un número específico, más bien es un ejemplo de valor para un conjunto de números.

--El parámetro como un desconocido. Consiste en seleccionar los casos particulares de la representación general del modelo que se está estudiando. Se trata de un ‘desconocido por encontrar’ (Bills, 2001).

El parámetro aparece también en el contexto de la estadística y las probabilidades. Específicamente existen dos momentos en que el parámetro es un elemento clave: al formular los modelos de probabilidad y, sobretodo, en la inferencia estadística paramétrica. Y es aquí donde surgen grandes confusiones acerca de su significado y utilización. Por ejemplo, Contasti y Matheus (2009) para su análisis de bondad de ajuste mencionan los parámetros como ‘constructos’ que deben ser estimados.

La pregunta es ¿Cómo un concepto tan importante, sobre el cual se basa gran parte de la estadística, no ha tenido un lugar especial en la enseñanza? Al estar el parámetro presente durante toda la estadística ¿Podría implicar su desconocimiento una dificultad en el aprendizaje de los contenidos de los cursos de estadística?¿Cuál es la diferencia entre el ‘parámetro estadístico’ y el ‘parámetro matemático’, que surge en los temas de álgebra, geometría y cálculo?

El Parámetro en la Enseñanza

Desde la pespectiva de Ursini y Trigueros (2004), los parámetros son números generales que asumen el rol de desconocido o variable relacionada y sirven para hacer generalizaciones de segundo orden. Ellos usan el modelo de los tres usos de la variable (3UV) como un marco teórico para analizar la interpretación, simbolización y manipulación del parámetro por parte de los estudiantes en diferentes contextos. Más aún, cuando el problema requiere moverse entre los diferentes roles de un parámetro (número general, desconocido o variable relacionada), se requiere poder manejar los aspectos que caracterizan cada uno de esos aspectos de uso de la variable de una manera apropiada.

Según Ursini y Trigueros, cuando el parámetro es percibido como un número general los estudiantes deben ser capaces de: relacionar los parámetros con reconocimiento de patrones o con la interpretación de reglas y métodos; interpretarlo como la representación de una entidad general e indeterminada que puede asumir cualquier valor; deducir reglas generales y métodos generales distinguiendo aspectos invariantes de las variables en las declaraciones generales de primer orden; manipularlo; simbolizarlo como representando declaraciones, reglas o métodos de segundo orden.

Cuando un parámetro asume el papel de un desconocido es necesario: reconocer que representa algo desconocido que puede ser determinado; interpretarlo como que representa valores específicos que se pueden determinar considerando las restricciones dadas; determinar sus valores llevando a cabo las operaciones algebraicas y/o aritméticas requeridas; sustituir los valores necesarios del parámetro con el fin de hacer que el condición dada sea verdadera.

Cuando un parámetro asume el papel de una variable relacionada con otra, es necesario que el estudiante:

reconozca la correspondencia entre las dos variables en la expresión analítica;

determine sus valores en términos del valor de la variable relacionada o determinar el valor de la variable relacionada en términos del valor del parámetro;

reconozca la variación conjunta del parámetro y de la variable relacionada;

determine el intervalo de variación del parámetro o de la variable relacionada cuando se da el intervalo de variación de la misma.

Bardini et al. (2005) hacen un estudio sobre el pensamiento algebraico de los estudiantes acerca de la variable y lo ligan con la comprensión del concepto de parámetro, un elemento indeterminado pero fijo de ‘los valores tomados’ por una variable. La paradójica naturaleza epistémica de este objeto algebraico se basa en su aparente contradicción: es un número en particular, fijo, pero que se mantiene indeterminado y que no es un número actual.

En el sistema didáctico propuesto por Chevallard (1997) es posible observar: 1) el estudiante accede por su cuenta a las fuentes del conocimiento; 2) el vínculo profesor-alumno está formado por el conocimiento que el primero quiere transmitir de manera formal; 3) la conexión entre el profesor y el conocimiento. El análisis de cualquiera de estos puntos nos lleva necesariamente a analizar los otros dos. Los estudiantes tienen un conocimiento general sobre la estadística, quizás por haberla visto en niveles previos al universitario, o simplemente por cultura general. Este conocimiento general no siempre está en correspondencia con el saber sabio, ni con el saber que el profesor pretende transmitir a sus alumnos. Se hace en ocasiones, por lo tanto, difícil el paso de la cultura general a la formal y de los niveles de enseñanza secundaria a la universitaria.

Basándose en la Teoría Antropológica de lo Didáctico, se aborda la siguiente cuestión: ¿Cómo conseguir que los conocimientos matemáticos que se estudian en el paso de la enseñanza secundaria a la universitaria en torno a la modelización funcional no se reduzcan a un conjunto desarticulado de conceptos y técnicas carentes de sentido... ? " (Fonseca et al., 2014: 297-298), y se definen tres niveles de modelización, basados en Ruiz-Munzón et al. (2011):

Primer Nivel: se materializa en modelos que se expresan mediante funciones aisladas de una única variable y las correspondientes ecuaciones (e inecuaciones) asociadas.

Segundo Nivel: los símbolos literales juegan el papel de incógnitas o variables. El papel de los parámetros está ausente, excepto en algunos casos muy particulares.

Tercer Nivel: el papel de los parámetros y de las variables es intercambiable. Entran en juego las familias de funciones de varias variables, tratando a parámetros y variables de la misma forma y asignándoseles el mismo sentido.

Un eje central en el estudio de la estadística es el parámetro. Éste se presenta desde que se inicia el curso, con los elementos de estadística descriptiva y sus antecedentes, hasta la inferencia. Sin embargo, es raro que el parámetro sea destacado como tal. De hecho, rara vez se define. Los libros de texto habituales suelen dar una definición somera del parámetro, identificándolo como una característica de la población. Pero no hay una conceptualización. Por lo general, mencionan el parámetro e inmediatamente lo ejemplifican, incluso en ocasiones con el promedio de la muestra. Es posible encontrar definiciones muy generales del parámetro basados en la idea de ‘característica de la población’ (Montgomery y Runger, 2004; Newbold et al., 2008; Anderson et al., 2012; Lind et al., 2012). Otras definiciones que intentan ser un poco más precisas son: una medida de resumen numérica de una distribución de frecuencias poblacional es llamado un parámetro (Koopmans, 1981); una medida descriptiva calculada a partir de los datos de una población se llama parámetro (Daniel y Cross, 2013); y, un estadístico se refiere a una característica de una muestra y un parámetro se refiere a una característica de la población (Sheskin, 2004).

Un poco más desarrolladas se tienen las siguientes definiciones del parámetro:

Un parámetro es una cantidad no especificada que se asume constante (Bean, 2001). Nótese que este autor da un ejemplo matemático de la física para mostrar el parámetro: la fórmula de la velocidad de un objeto lanzado verticalmente al aire.

Suponga que p(x) depende de una cantidad a la que se le puede asignar cualquiera de varios valores posibles, donde cada valor diferente determina una distribución de probabilidades distinta. A esa cantidad se le llama parámetro de la distribució. (Devore, 2008).

Un parámetro es el valor verdadero de una propiedad de una población (por ejemplo, la media de una medición en particular) (Mongan et al., 2016).

En el libro de texto de Meyer (1992) se hace una introducción al parámetro desde la ecuación de la recta y finaliza diciendo "En los modelos matemáticos no determinísticos o aleatorios que hemos considerado, los parámetros también pueden usarse para señalar la distribución de probabilidades... Los parámetros dan información valiosa acerca de la distribución" (Meyer, 1992: 153).

En Mendenhall y Sincich (2007: 39) se da formalmente la definición: "Un parámetro es una medida descriptiva numérica de una población". La definición es la siguiente a la de ‘una estadística’, por lo que da la impresión que se desea mostrar una similaridad entre ambas: "Una estadística es una medida descriptiva numérica calculada a partir de datos de muestra" (Mendenhall y Sincich, 2007: 39).

Un referente en la formación de los estadísticos en España, Sixto Ríos, formula la siguiente introducción al parámetro (Ríos, 1971: 71): “El estudio y comparación de distribuciones de probabilidad y de frecuencia puede simplificarse definiendo a partir de ellas ciertas constantes que vienen a caracterizar la tendencia central (...), dispersión (...), etc. …Llamaremos a tales constantes, que caracterizan parcial o totalmente la distribución, características estocásticas o valores típicos de la misma... Cuando una distribución queda individualizada por uno o más parámetros, que entran en su expresión analítica, puede existir una relación sencilla entre los valores típicos y estos parámetros. Conviene, sin embargo, no confundir parámetros con características estocásticas aunque en algunos casos particulares coincidan sus valores."

En definitiva, hay una gran confusión por parte de los estudiantes acerca del significado conceptual del parámetro, debido a la variedad de conceptos que existen en la literatura (ver Beckman y delMas, 2018).

El parámetro es un concepto clave en la enseñanza de la estadística en general. En estadística descriptiva se estudian diferentes medidas que buscan explicar los fenómenos de la población en estudio, a través de muestras. Se trata, por tanto, de un primer acercamiento a estudiar características de la población. Elementos tales como promedio, mediana, moda, entre otros, no son más que herramientas para poder describir la muestra y, a través de ella, a la población. Más adelante, los modelos de probabilidad están construidos en base a los parámetros. Los diferentes modelos son planteados de forma general, haciendo que los parámetros los identifiquen como particulares. Es en la ‘inferencia estadística’ donde se comienzan a plantear dudas sobre el parámetro, se le estima y se le confronta con otros valores posibles. De esta forma, el parámetro consigue ser un eje del estudio de la estadística.

De hecho, los dos principales paradigmas que en la actualidad sustentan la estadística, el frecuentista y el subjetivista, se diferencien en cómo ellos conciben el parámetro. Considerado que es un valor desconocido, por una parte la estadística clásica lo trata como un valor fijo, mientras que la bayesiana modela su incertidumbre como variable aleatoria, asignándole al parámetro una distribución de probabilidades.

En la práctica, tal como se está definiendo matemáticamente, el parámetro no existe en la estadística descriptiva. No se trabaja con funciones matemáticas. Sin embargo sí existe la idea de parámetro como una caracterización.

En estadística descriptiva se busca realizar análisis de conjuntos de datos, que por lo general están basados en muestras obtenidas a partir de cierta población. Las medidas características que se calculan a partir de los datos pasan a ser descripciones de los mismos. De hecho, si se está tratando con muestras, corresponden a estimaciones de las medidas características poblacionales, las que pueden ser sus parámetros o funciones de ellos.

El parámetro funciona de manera implícita, pues efectivamente se están analizando poblaciones, ya sea directamente o a través de muestras. Y dichas poblaciones están caracterizadas por sus respectivos parámetros. Por lo tanto, es importante hacer énfasis en la existencia de los parámetros como caracterizadores de las poblaciones.

En los modelos de probabilidad, los parámetros suelen surgir para respaldar una generalización de las funciones de cuantía o de densidad. Es así como dichos parámetros pueden ser directamente una medida característica del modelo (p.ej., el caso de la distribución normal con media μ y varianza σ.) o una función de esa medida característica (p.ej., el caso de la distribución exponencial con parámetro λ). De una u otra forma, cada parámetro cumple su papel de manera muy específica e irreemplazable.

Tomemos como ejemplo el modelo binomial. Aquí tenemos tres variables: la aleatoria y dos parámetros. Un breve análisis de los parámetros de este modelo nos lleva a destacar lo siguiente:

El parámetro ‘p’ es llamado por Mood y Graybill (1963) ‘parámetro continuo’ de la binomial. Se trata de la probabilidad de que ocurra el evento que se está estudiando, a lo cual también se le suele llamar ‘probabilidad de éxito’. En la modelización, se suele suponer que n es un valor fijo. El parámetro p surge, sin embargo, de la idea de proporciones, es decir, lo que históricamente se ha observado. Por lo tanto, en las estimaciones de p, es de esperar que las cosas sigan como estaban y la proporción observada sea considerada también como la proporción poblacional.

El parámetro ‘n’ es el considerado ‘parámetro discreto’ según Mood y Graybill (1963). Si se supone fijo a p, n es un parámetro desconocido que se desea estimar. Surge en muchas situaciones, por ejemplo en la estimación de tamaños poblacionales finitos (Mukhopadhyay, 1998) o en el muestreo aleatorio simple con reemplazamiento. También existen aplicaciones en el conteo de animales (Rukhin, 1975). Las estimaciones de n se basan por lo general en el supuesto que p sea fijo y conocido. Hay estudios bayesianos que también realizan la estimación de ambos parámetros.

Cabe recordar que el modelo binomial resulta de una repetición de forma independiente de experimentos de Bernoulli, cada uno con probabilidad p de éxito. Esto repercute en el sentido de ambos parámetros. Una vez realizados los experimentos, n es fijo y no tiene sentido estimarlo. Por su parte p pasa a ser una proporción de éxitos.

Es evidente, por lo tanto, que ambos parámetros, que identifican y caracterizan al modelo binomial, tienen roles totalmente muy distintos, los cuales dependen del papel que debe cumplir el modelo en una situación específica. En problemas de clases, por lo general se considera conocido el parámetro n y se intenta estimar p.

Los estimadores que habitualmente se calculan como medidas características existen porque efectivamente ‘estiman’ a un parámetro, sea éste visible o no. No está aún el concepto de modelos probabilísticos, por lo que la población será el conjunto de individuos que tienen características comunes. Tiene, entonces, sentido pensar en que en estadística descriptiva, la mejor idea de parámetro pueden ser las medidas características.

En modelos de probabilidad recién introducimos la idea de funciones, ya sea de cuantía o de densidad, llamémoslas a todas ‘funciones de probabilidad’. Dichas funciones son únicas para cada caso. Una forma de identificar diferentes casos que tienen un comportamiento similar es plantear las funciones en base a parámetros. Hasta ahí se tiene el concepto matemático de parámetro. Sin embargo, estadísticamente ese parámetro adquiere un sentido mucho más amplio. El parámetro generaliza la función de probabilidad y además le da sentido.

Por su parte, según los modelos que se estudian, los parámetros pueden identificar una medida característica de la población. En algunos casos, el parámetro corresponde directamente a alguna medida característica (Bernoulli, Poisson, normal), en otros es una función de la misma (binomial, geométrica, uniforme, exponencial…).

En inferencia estadística el parámetro toma su lugar, siendo el centro de estudio. Su papel de generalizador pasa a segundo plano, siendo ahora el caracterizador el rol que se estudia. Para ello, se recurre a las estimaciones en base a la estadística descriptiva de los parámetros. Desde el punto de vista de la estadística clásica, el parámetro es fijo, pero desconocido. Por lo tanto, el interés se centra en intentar saber lo más posible acerca de él.

En síntesis, para la estadística, el parámetro juega el papel de generalizador y ‘desconocido’, según la clasificación que resume Drijver (2003). Además, podemos afirmar que el parámetro tiene un rol de ‘caracterizador’. El parámetro puede ser considerado como generalizador, pues es un rol que intrínsecamente adquiere al formar parte de funciones de probabilidad (funciones de cuantía o funciones de densidad con sus correspondientes funciones de distribución). A través del parámetro es posible plantear funciones y asumirlas como generalizables en función de los valores que pueda tomar el parámetro. Por otra parte, el parámetro juega el rol de ‘desconocido’. Si bien caracteriza al modelo, a partir de los datos solo se pueden obtener estimaciones del parámetro, pero su valor verdadero no se conoce. De hecho, una de las formas de estudiar el modelo es justamente estimando el valor desconocido del parámetro.

Por último, el parámetro no solo se limita a generalizar una función de probabilidad, la cual, en función de los valores que dicho parámetro tome, podría convertirse en un enjambre de gráficas. Para cada problema en estudio se busca una función de probabilidad específica, a la cual se podría llegar teóricamente quitándole el rol de ‘desconocido’. Visto así, el parámetro es un elemento fundamental que por sí mismo tiene interpretación y sus características lo llevan a definir adecuadamente a la población. A través del parámetro somos capaces de identificar y describir a la población. No conocemos el valor del parámetro, por lo tanto afirmamos que él presenta incertidumbre. De esta forma, sobre ese parámetro se harán las inferencias que sustentarán el modelo mismo. Esta es una gran diferencia entre el parámetro estadístico y el matemático.

Conclusiones

El parámetro ha tenido históricamente un desarrollo paralelo al de las variables, considerándose como tal por mucho tiempo. De hecho, ha sido un elemento esencial para la formulación de funciones y generalización de soluciones a ecuaciones. Es así como desde cursos pre-universitarios, los estudiantes saben de su existencia y trabajan con ella, aparentemente sin mayores dificultades.

En estadística, el parámetro toma en parte el concepto matemático de generalizador, sobre todo para formular funciones de probabilidad que requieren ser escritas en una forma fácilmente extendible a cada uno de los casos que puedan representar. Además, forma parte de un eje de estudio, que por sí mismo forma gran parte de la teoría estadística moderna. El parámetro permite caracterizar las distribuciones de probabilidad, explicar modelos, extender interpretaciones de las medidas características obtenidas en muestras a poblaciones y, para ciertos paradigmas, incluso puede tener una distribución propia. El hecho que el parámetro estadístico sea un objeto a estudiar a partir de la estimación, marca una gran diferencia con el parámetro matemático. El parámetro es un desconocido, pero estimable gracias a las metodologías estadísticas. Se estudia, por tanto, la incertidumbre del parámetro.

Al enfrentarse el estudiante con la estadística formal por primera vez, debe ser capaz de observar el parámetro en el contexto de la estadística. Y para eso requiere un adecuado direccionamiento hacia sus implicancias desde un comienzo, pues en caso contrario, puede serle difícil comprender el paso de generalizador (matemático) a caracterizador (estadístico). Una adecuada vigilancia epistemológica podrá asegurar que el parámetro esté siempre presente en el lenguaje del curso de estadística, de modo que de manera intrínseca tome su papel protagonista. Las transformaciones del objeto de conocimiento (parámetro) con la finalidad de hacerlo un objeto de la enseñanza están determinadas por el imperativo de las condiciones epistemológicas del mismo.

En estadística, el parámetro juega un papel propio en que permite caracterizar los modelos, más que simplemente generalizarlos. El estudiante podrá de esta forma comprender que el parámetro se transforma en un objeto de estudio en gran parte de la inferencia estadística, pues al extraer sus características consigue también caracterizar a la población que de él depende.

Es importante que el parámetro sea introducido de forma visible desde el comienzo de un curso de estadística, marcando desde ya cómo se transforma de matemático a estadístico. Las dificultades conceptuales que los estudiantes tienen a lo largo de su formación estadística pueden reducirse, pues el hecho de que un objeto de estudio como el parámetro ahora sí tenga significado y pueda acompañar al estudiante en su formación, permitirá situarlo en el lugar que siempre le ha correspondido y que, de hecho, toma en la inferencia estadística.

UN ANÁLISIS EPISTEMOLÓGICO HISTÓRICO DEL PARÁMETRO Y SU INFLUENCIA EN LA ENSEÑANZA DE LA ESTADÍSTICA

Anderson D, Sweeney D, Williams T (2012) Estadística para Negocios y Economía. Cengage. México. 1061 pp.

Ang H, Skahrill M (2014) Identifying students’ specific misconceptions in learning probability. Int. J. Probab. Stat. 3: 23-29.

Bardini C, Radford L, Sabena C (2005) Struggling with variables, parameters, and indeterminate objects or how to go insane in mathematics. En Chick HL, Vincent JL (Eds.) Proc. 29th Conf. Int. Group for the Psychology of Mathematics Education. Vol II. Melbourne, Australia. pp. 129-136.

Bean M (2001) Probability: The Science of Uncertainty with Applications to Investments, Insurance and Engineering. Brooks/Cole. Pacific Grove, CA, EEUU. 448 pp.

Beckman MD, delMas R (2018) Statistics students’ identification of inferential model elements within contexts of their own invention. ZDM 50: 1295-1309.

Bernardo J, Smith A (2000) Bayesian Theory. Wiley. Chichester, RU. 608 pp.

Bills L (2001) Shifts in the meanings of literal symbols. En van den Heuvel-Panhuizen M (Ed.) Proc. 25th Conf. Int. Group for the Psychology of Mathematics Education. Vol. 2. Utrecht, Holanda. pp. 161-168.

Bloedy-Vinner H (1994) The analgebraic mode of thinking: The case of parameter. En Da Ponte JP, Matos JF (Eds.) Proc. 18th Int. Conf. for the Psychology of Mathematics Education. Vol. 2. Lisboa, Portugal. pp. 88-95.

Chevallard Y (1997) La Transposición Didáctica. Del Saber Sabio al Saber Enseñado. AIQUE. Buenos Aires, Argentina. 151 pp.

Contasti M, Matheus E (2009) Procedimientos y fórmulas estadísticas para medir la influencia herencia/ambiente sobre caracteres métricos en poblaciones humanas. Interciencia 34: 457-462.

Cortínez A, Alamilla N, Albert JA, Ríos J (2015) Razonamiento acerca del significado de los parámetros en los modelos de probabilidad en estudiantes universitarios. En Flores R (Ed.) Acta Latinoam. Matem. Educ. 28: 283-290.

Daniel W, Cross C (2013) Bioestatistics. A foundation for Analysis in the Health Sciences. 10. ed. Wiley. Hoboken, NJ, EEUU. 960 pp.

Devore J (2008) Probabilidad y Estadística para Ingeniería y Ciencias. 7. ed. Cengage. México. 816 pp.

Drijver P (2003) Learning Algebra in a Computer Algebra Environment: Design Research on the Understanding of the Concept of Parameter. CD-β Press. Utrecht, Holanda. 382 pp.

Fisher R (1925) Theory of statistical estimation. Math. Proc. Cambridge Philos. Soc. 22: 700-725.

Fonseca C, Gascón J, Oliveira C (2014) Desarrollo de un modelo epistemológico de referencia en torno a la modelización funcional. Rev. Latinoam. Inv. Matem. Educ. 17: 289-318.

Giessen C van de (2002) The visualisation of parameters. En Borovcnik M, Kautschitsch H (Eds.) Technology in Mathematics Teaching. Oebv&hpt. Viena, Austria. pp. 97-100.

Koopmans LH (1981) An Introduction to Contemporary Statistics. 2. ed. Duxbury Press. Boston, MA, EEUU: 599 pp.

Laplace P (1781) Mémoire sur les Probabilités. En Memoirs de l'Académie Royale des Sciences de Paris 1778(1781). Oevres complètes 9: 227-232.

Lem S, Onghena P, Verschaffel L, Van Dooren W (2013) On the misinterpretation of histograms and box plots. Educ. Psychol. 33: 155-174.

Lind D, Marchal W, Wathen S (2012) Estadística Aplicada a los Negocios y la Economía. 15ª ed. McGraw-Hill. México. 889 pp.

Mendenhall W, Sincich T (2007) Statistics for Engineering and the Sciences. 5. ed. Prentice Hall. Upper Saddle River, NJ, EEUU. 1072 pp.

Meyer P (1992) Probabilidad y Aplicaciones Estadísticas. Addison-Wesley. Wilmington, DE, EEUU. 489 pp.

Mongan J, Sebro R, Lavelle LP, Carroll AG, Malone DE, Dunne RM, Samir AE (2016) Dr Anvari and colleagues respond. RadioGraphics 36: 1602-1602.

Montgomery D, Runger G (2004) Probabilidad y Estadística Aplicadas a la Ingeniería. Limusa. México. 486 pp.

Mood A, Graybill F (1963) Introduction to the Theory of Statistics. 2. ed. McGraw-Hill. Nueva York, EEUU. 548 pp.

Mukhopadhyay P (1998) Small Area Estimation in Survey Sampling. Narosa. Londres, RU. 241 pp.

Newbold P, Carlson W, Thorne B (2008) Estadística para Administración y Economía. Pearson. Madrid, España. 1087 pp.

Ríos S (1971) Métodos Estadísticos. McGraw-Hill. México. 520 pp.

Ruiz-Munzón N, Bosch M, Gascón J (2011) Un modelo epistemológico de referencia del algebra como instrumento de modelización. En Bosch M, Gascón J, Ruiz Olarría A, Artaud M, Bronner A, Chevallard Y, Cirade G, Ladage C, Larguier M (Eds.) Un Panorama de la TAD 10. Centre de Recerca Matemàtica. Barcelona, España. pp. 743-765.

Rukhin AL (1975) Statistical decision about the total number of observable objects. Sankhyā: Ind. J. Stat. A37: 514-522.

Sheskin D (2004) Handbook of Parametric and Nonparametric Statistical Procedures. 5. ed. CRC Press. Boca Raron, FL, EEUU. 1926 pp.

Student (1908) The probable error of a mean. Biometrika6: 1-25. Reprinted in Pearson ES, Wishart J (Eds., 1942) Student’s Collected Papers. Cambridge University Press. pp. 11-34.

Ursini S, Trigueros M (2004) How do high school students interpret parameters in algebra? En Johnsen M, Berit A (Eds) Proc. 28th Conf. Int. Group for the Psychology in Mathematics Education. Bergen, Norway. Vol. IV. pp. 361-269.

Notas de autor

acortinezp@academicos.uta.cl

HTML generado a partir de XML-JATS4R por