Resumen:
Los mitos de violación son actitudes y creencias generalmente falsas, amplias y persistentes, acerca de la violación, la víctima y el agresor, que son utilizadas para negar o justificar la agresión sexual hacia las mujeres. En las últimas dos décadas, los instrumentos más utilizados para medir este constructo corresponden a la escala de aceptación de mitos de violación de Illinois (IRMAS), que utiliza expresiones directas y explícitas mediante un lenguaje clásico, y la escala de aceptación de mitos modernos de agresión sexual (AMMSA) que usa un lenguaje sutil, indirecto y moderno. Se realizó un metaanálisis de generalización de la fiabilidad de 69 estudios empíricos que utilizaron alguna de las dos escalas de mitos de violación. El objetivo fue estimar la fiabilidad media de las puntuaciones combinadas de las escalas IRMAS y AMMSA para obtener un valor aproximado de su fiabilidad general y evaluar el posible efecto moderador de algunas variables de interés. El promedio de la fiabilidad por consistencia interna de las puntuaciones de las escalas para las 98 muestras estudiadas fue de .85, IC95 % [.84, .86]. Se observó una alta heterogeneidad (I. = 96 %), y el número de ítems es la única variable moderadora que explica significativamente la variabilidad de la fiabilidad observada. Estos resultados muestran que ambas escalas presentan índices de consistencia interna aceptables en sus diversas aplicaciones. Por lo tanto, las medidas de aceptación de mitos de violación cumplen con los criterios de fiabilidad adecuados para ser utilizadas en investigaciones empíricas en distintos contextos.
Palabras clave: mitos de violación, metaanálisis, generalización de la fiabilidad, escala, medición.
Abstract:
Rape myths are widespread and persistent attitudes, beliefs, and stereotypes, usually false, about rape, the victim, and the perpetrator. Their function is to deny and justify sexual assaults against women, affecting the victim's attributions of responsibility and the perpetrator's attributions of guilt in rape cases. These myths exert a bias in the processing of information, directing attention and perception toward stimuli that justify the victim's responsibility for sexual aggression. These beliefs can be grouped into several types of myths: Myths that hold the victim responsible by arguing that women should be careful and not expose themselves to avoid sexual aggression, myths that justify and reduce the responsibility of the aggressor by stating that the man could not contain his sexual desire and those myths that deny or normalize sexual aggression, which propose that rape occurs only in very specific contexts. In the last two decades, the instruments most commonly used to measure these beliefs are The Illinois Rape Myth Acceptance Scale (IRMAS), which uses direct and explicit expressions through classic language, and the Modern Sexual Assault Myth Acceptance Scale (AMMSA), where its expressions are modern, subtle and indirect. Considering the wide use of these instruments, it is justified to provide empirical evidence showing information on the psychometric properties of these scales. One of the procedures for synthesizing empirical results is meta-analyses (MA). This methodology can synthesize studies of specific variables and analyze the psychometric properties of the measurement instruments, providing relevant information on the quality of a given scale. Within this last type of RM are reliability generalizations (RG), those that study the reliability coefficients obtained in different applications of a scale, providing evidence on the properties of the measures used in measuring a construct. A meta-analysis of the RGs of 69 empirical studies that used any of the rape myth scales was performed. The objective was to estimate the mean reliability of the combined scores of the IRMAS and AMMSA scales to obtain an approximate value of their overall reliability and to assess the possible moderating effect of some variables of interest (e.g., research design, culture, sample type, etc.). The mean internal consistency reliability of the scale scores for the 98 samples studied was .85, 95 % C.I. [.84, .86] and the mean coefficient for each of the IRMAS and AMMSA scales was .84 and .85 respectively. All these values are above .80, a value established as satisfactory reliability of the instrument for general research. The Cronbach's alpha coefficients reported by the studies ranged from .71 to .98, with values considered moderate to excellent. These results show that both scales present acceptable internal consistency indices in various applications. There is high heterogeneity (I. = 96 %), with the number of items being the only moderating variable significantly explaining the observed reliability variability. This result was to be expected, given that the effect of test length on the estimation of reliability indices has a long tradition and is widely known in the psychometric literature.
Keywords: rape myths, meta-analyses, reliability generalization, scale, measurement.
Revisiones
Metaanálisis de generalización de la fiabilidad de los mitos de violación
Meta-analysis of reliability generalization of the rape myths

Este constructo teórico ha sido investigado empíricamente desde la década de los ochenta y ha mostrado evidencia acerca del rol que cumple en las atribuciones de responsabilidad de la víctima y del agresor en casos de violencia sexual (Dawtry et al., 2018). Las investigaciones sugieren que, a mayor aceptación de mitos de violación, mayor es la atribución de responsabilidad asignada a la víctima y menor es la culpa atribuida al agresor (Murray y Calderón, 2021; Süssenbach et al., 2015).
Estas creencias pueden ser agrupadas en diversos tipos de mitos: mitos que responsabilizan a la víctima con el argumento que las mujeres deben ser cuidadosas y no exponerse para evitar la agresión sexual; mitos que justifican y disminuyen la responsabilidad del agresor al plantear que el hombre no pudo contener su deseo sexual o que no se dio cuenta de que estaba forzando a la mujer, y aquellos mitos que niegan o normalizan las agresiones sexuales, y que proponen que la violación solo ocurre en contextos muy específicos o que son parte de una forma de relación de las parejas (Burt, 1980; Gerger et al., 2007; Payne et al., 1999).
Para valorar este constructo, se han utilizado diversos instrumentos. Sin embargo, los que han sido ampliamente estudiados en la última década, principalmente en Estados Unidos y países de Europa (Murray y Calderón, 2021), son la escala de aceptación de mitos de violación de Illinois IRMAS (McMahon y Farmer, 2011; Payne et al., 1999) y la escala de aceptación de mitos modernos de agresión sexual AMMSA (Gerger et al., 2007). Ambas escalas miden la aceptación de los mitos de violación que se aproxima al fenómeno desde una expresión clásica (IRMAS) o moderna (AMMSA), que se evidencian en el lenguaje con el que se refieren a la violencia sexual en contra de las mujeres (Gerger et al., 2007; McMahon y Farmer (2011).
La escala IRMAS está compuesta por 45 ítems y cuenta con una versión resumida de 20 ítems, que se caracteriza por afirmaciones con lenguaje directo y explícito acerca de las violaciones, por ejemplo: “la violación ocurre cuando la libido de un hombre está fuera de control” (Payne et al., 1999). McMahon y Farmer (2011) realizaron una versión adaptada –Updated Illinois Rape Myth Aceptance Scale (UIRMAS)– con el propósito de reducir el número de ítems en 22, y de modificar algunas expresiones en el lenguaje para modernizar el instrumento.
La escala AMMSA tiene 30 ítems en su versión completa y 16 ítems en su versión breve. Esta escala mantiene los mitos de violación clásicos, pero busca modernizar el lenguaje al utilizar expresiones sutiles e indirectas con relación a las agresiones sexuales como, por ejemplo: “La sexualidad de un hombre funciona como una olla a presión; cuando la presión es muy alta, tiene que soltar vapor” (Camplá et al., 2019; Eyssel et al., 2006; Gerger et al., 2007).
Las escalas IRMAS y AMMSA han sido adaptadas y validadas en diversos países (Alemania, Israel, México, Nigeria, Noruega, Rusia) y generó una amplia evidencia de las propiedades psicométricas para la medición de los mitos de violación en distintos contextos culturales (Fakunmoju, Abrega-Gyan y Maphosa, 2019; Gerger et al., 2007; Jakobsen, 2016; Khokhlova y Bohner, 2020; Romero-Sánchez, 2012; Tal-OryTsfati, 2015), lo que ha permitido mostrar la transversalidad de la aceptación de los mitos de violación en las distintas regiones del mundo (Fakunmoju et al., 2018; Gerger et al., 2007).
Metaanálisis
El metaanálisis (MA) surge como respuesta a la necesidad de proporcionar mayor rigurosidad en las revisiones de la literatura científica, al aportar procedimientos cuantitativos que posibilitan desarrollar una investigación con la misma exigencia de las investigaciones primarias (Cooper, 2015). Los MA permiten establecer logros alcanzados en un área del conocimiento, revisar el estado del arte de un constructo, entregar evidencia para la interpretación adecuada de los datos (Botella y Sánchez-Meca, 2015) y es una herramienta relevante para la inferencia científica (Gallegos et al., 2020).
En el ámbito de la psicometría, los MA estudian la fiabilidad obtenida en las distintas aplicaciones de un instrumento, con la finalidad de entregar información relevante acerca de las propiedades de las medidas empleadas en la medición de un constructo (Sánchez-Meca et al., 2012).
La fiabilidad es entendida como el grado en que las mediciones son estables y replicables con distintas formas, versiones y adaptaciones de una escala o test, en diferentes momentos y condiciones (Abad et al., 2011). Además, muestra evidencia de la calidad de la medida del instrumento en una aplicación determinada y específica, con valores que no pueden ser atribuidos a una propiedad intrínseca de la escala (Badenes-Ribera et al., 2020). Por lo tanto, es deseable que las estimaciones de la fiabilidad de un instrumento no varíen de una administración a otra (Sánchez-Meca et al., 2012).
Los MA que estudian la fiabilidad de las medidas se denominan estudios de generalización de la fiabilidad (GF). Este tipo de estudios tienen como propósito ampliar la comprensión de los factores que influyen o afectan la fiabilidad de un instrumento y cómo este conocimiento puede contribuir a mejorar la interpretación de los resultados de las investigaciones primarias (Botella y Sánchez-Meca, 2015). En particular en los GF se espera que la heterogeneidad en las puntuaciones no sea explicada por moderadores, para que el instrumento muestre solidez en la aplicación en sus diversas formas, momentos y condiciones (Botella et al., 2010).
Al considerar la amplia utilización en diferentes contextos de las escalas IRMAS y AMMSA en la medición del constructo mitos de violación, la presente investigación –que contó con la aprobación del Comité de Ética Científica mediante la resolución 024/2019 de la Universidad Católica del Norte, Chile– tiene como propósito estimar la fiabilidad media de las puntuaciones combinada de estas dos escalas, por la que se obtiene un valor de referencia aproximado de su fiabilidad general, e identificar qué características de los estudios primarios o variables moderadoras podrían explicar las diferencias en sus coeficientes de fiabilidad observados.
Se realizó una revisión de la literatura para la que se siguieron los lineamientos y recomendaciones de la declaración PRISMA (Liberati et al., 2009). Se consideraron artículos publicados entre los años 2005 al 2020 y se consultaron las bases de datos digitales: Web of Science (n = 492), Scopus (n = 443), ProQuest (n = 442), PsycINFO (n = 93), EBSCOhost (n = 212), JSTOR (n = 198) y se complementó la búsqueda con Google Académico (n = 193). Se consideraron trabajos publicados en inglés y español, a través de las palabras claves “aceptación de mitos de violación” y “rape myth acceptance”. La búsqueda se acotó a las áreas de investigación en psicología social, ciencias sociales y ciencias del comportamiento. Se incluyeron solo artículos que presentaron datos empíricos de las escalas seleccionadas para el estudio de GF, y se descartó todo estudio que no entregara información del alfa de Cronbach obtenida de la muestra en estudio.
El proceso de selección de los estudios primarios consideró cuatro etapas. Primero, se compilaron todos los artículos recolectados en las bases de datos antes señaladas (n = 2078), publicados entre los años 2005 y julio del 2020. Segundo, se leyeron los títulos y se eliminaron todos los artículos duplicados (n = 849). Tercero, se procedió a la lectura de títulos, resúmenes, palabras claves e instrumentos utilizados en cada artículo y se eliminaron los artículos que no cumplían con los criterios de inclusión; los que respondían a estudios realizados con metodologías cualitativas; los estudios teóricos, y los que utilizaron medidas de los mitos de violación distintas a las escalas IRMAS o AMMSA (n = 135). Cuarto, se llevó a cabo la lectura de los textos en los que se eliminaron los artículos que consideraron muestras utilizadas en otro estudio y que no reportaron el alfa de Cronbach del instrumento completo. De este proceso, se obtuvo un total de 69 artículos que cumplían con los criterios de selección (Figura 1).

Cada estudio se codificó de acuerdo con diversas variables moderadoras, tanto contextuales como metodológicas (Botella et al., 2010). Una vez finalizada la selección de los estudios primarios (n = 69), se procedió a la síntesis de resultados con el fin de comparar las diferentes publicaciones.
Los datos extraídos fueron: (1) autor/es; (2) tamaño de la/s muestra/s; (3) número de ítems; (4) año de publicación; (5) diseño de la investigación; (6) instrumento de mitos de violación; (7) cultura (Europa, Latinoamérica, Norteamérica, Asia y África); (8) sexo de la muestra (solo mujeres, solo hombre y mixta); (9) porcentaje de mujeres en la muestra; (10) tipo de muestra (estudiantes universitarios, población general, policía y ley); (11) edad media de la muestra; y (12) reporte del alfa de Cronbach de los instrumentos. Conforme al objetivo del estudio, se eliminaron todos los artículos que no presentaban los datos antes señalados o que no reportaron claramente los resultados.
Para la realización del estudio de GF de los 69 estudios incluidos, se obtuvo un total de 98 muestras con sus respectivos índices de fiabilidad. Del total de estudios, el 74 % entregaron información de una muestra, el 20.3 % informaron dos muestras, 4.3 % informaron tres muestras y el 1.4 % entregó datos de 10 muestras. Además, 48 estudios utilizaron solo la escala IRMAS, 17 la escala AMMSA y cuatro estudios usaron ambas escalas. Dentro de los estudios que aplicaron ambas escalas se obtuvieron datos de las escalas correlacionadas en nueve muestras, lo que evidenció correlaciones entre .78 y .87 en ocho de las muestras (Gerger et al., 2007; Hantzi et al., 2015; Jakobsen, 2016) y una muestra con resultados de .63 en su correlación (Watson, 2016).
Se combinaron los resultados de las alfas de ambas escalas, dado que representan a un mismo constructo teórico, procedimiento que se ha realizado en estudios de MA y de GF (Greco et al., 2018; Olderbak et al., 2021).
La varianza y los intervalos de confianza para cada coeficiente alfa de Cronbach fueron estimados con la transformación de Hakstian-Whalen (1976). Se asumió un modelo de efectos aleatorios para obtener estimaciones de fiabilidad promedio y para evaluar el posible efecto de las variables moderadoras en la variabilidad de los coeficientes de confiabilidad en las diferentes escalas de mitos de violación IRMAS y AMMSA. El modelo de efectos aleatorios asume que el conjunto de estudios primarios es una muestra de todos los posibles estudios de fiabilidad, bajo el supuesto de que la variabilidad de las diferencias en los resultados de los coeficientes alfas se deben al error de muestreo y a la variabilidad interestudios (Botella y Sánchez-Meca, 2015).
Los análisis estadísticos se realizaron con el paquete metafor (Viechtbauer, 2010) para el lenguaje estadístico R (R Core Team, 2020) con interfaz RStudio. Se utilizó como estimador de la varianza interestudios el estadístico DL (DerSimonian y Laird, 1986). Este estimador representa la variabilidad de los estudios primarios y considera la variabilidad de las varianzas estimadas en cada estudio primario, que es uno de los estimadores de uso frecuente en los MA (Botella y Sánchez-Meca, 2016; Kontopantelis y Reeves, 2012).
Para determinar la homogeneidad de los coeficientes alfas, se aplicó la prueba Q de Cochran, que contrasta la hipótesis nula de que los estudios primarios están estimando un mismo efecto paramétrico común (en nuestro caso los coeficientes de fiabilidad). Además, se obtuvo el índice I., el cual estima el porcentaje de variabilidad de las estimaciones que no es debida al error muestral intraestudio (Huedo-Medina et al., 2006). Los valores de I. en torno a 25 %, 50 % y 75 %, son reflejo de heterogeneidad baja, media y alta respetivamente (Huedo-Medina et al., 2006).
Se realizó análisis de moderadores mediante metarregresión para las variables continuas y para las variables categóricas análisis de Meta-anova, según los coeficientes de fiabilidad como variable dependiente y las variables moderadoras como independientes (Botella y Sánchez-Meca, 2015). Finalmente, se realiza análisis de sesgo de publicación para evidenciar si los estudios incluidos son representativos de la población (Rothstein et al., 2005).
Las estimaciones de fiabilidad mediante el alfa de Cronbach de las 98 muestras incluidas variaron entre .71 y .98, con fiabilidad media de .85 (IC95 % .84 - .86). El estadístico de heterogeneidad Q de Cochran (Sánchez-Meca et al., 2016), que analiza la homogeneidad de los resultados, mostró un valor Q(97) = 2 823.8, p-valor < .0001, y un alto índice I. de 96.6 %, lo que implica una elevada heterogeneidad entre los coeficientes alfas de las muestras en estudio (Badenes-Ribera et al., 2020).
A pesar de la alta heterogeneidad detectada, es posible observar que el límite inferior del intervalo de confianza de la fiabilidad media (.84) se encuentra muy por encima del valor mínimo aceptable (.80), lo cual muestra en términos generales que las escalas presentan indicadores de fiabilidad bastante altos. La fiabilidad media para la escala IRMAS fue de .84 (IC 95 % .83 - .86) y para la escala AMMSA de .85 (IC 95 % .83 - .87), valores sobre .70 valor mínimo considerado como aceptable.
Dada la alta heterogeneidad de los coeficientes de fiabilidad de los estudios, se procedió a realizar un análisis de moderadores que pudieran explicar la gran variabilidad entre los coeficientes alfas de las aplicaciones de los instrumentos de mitos de violación: IRMAS y AMMSA. Se realiza una metarregresión para las variables continuas: tamaño de la muestra, número de ítems, año de publicación, porcentaje de mujeres y su edad media.
En la Tabla 1 se describen los estadísticos de las variables continuas y los resultados de las metarregresiones de cada variable moderadora. El número de ítems es la única variable que muestra asociación estadística significativa con el alfa de los estudios (. = .049), con un porcentaje de varianza explicada, del 4.5 % (R. = .045). Este resultado era esperado, debido a la conocida relación entre la fiabilidad y la longitud del test. Para las otras variables moderadoras continuas no se observaron relación estadística significativa.

Nota: K = número de estudios. QE = estadístico de contraste de la especificación del modelo. bj = coeficientes del modelo de regresión. zj = estadístico de contraste del coeficiente. p = nivel de significancia asociada a Z. QM = estadístico de contraste del moderador. R2 = proporción de la varianza explicada por la variable moderadora. * p < .05. ** p < .01. *** p < .001.
La Figura 2 muestra un gráfico de burbujas que representa la relación entre el número de ítems y las alfas de Cronbach sin transformar. Cada burbuja representa a los 98 estudios y su superficie representa el tamaño de la muestra. La recta de regresión se estimó mediante la media condicionada y el método de mínimos cuadrados (Chang, 2018). Se puede observar que las alfas de Cronbach aumentan su valor en la medida que se incrementa el número de ítems de las medidas de aceptación de mitos de violación.

Para las variables categóricas se llevó a cabo un análisis ANOVA cuyos resultados se presentan en la Tabla 2. Los resultados muestran que ninguna de las variables categóricas analizadas resultó ser moderador significativo de la heterogeneidad de la fiabilidad de los estudios.

Nota: K = número de estudios. M = media de los α ponderados. IC95 % = Intervalo de confianza. QE = estadístico de contraste de la especificación del modelo. QM = estadístico de contraste del moderador. p = nivel de significancia. R2 = proporción de la varianza explicada por la variable moderadora. *** p < .001.
Mediante la regresión de Egger se identificó que existe sesgo de publicación t(96) = -3.60, p < .0005, lo que sugiere que no se incorporaron todos los estudios en el mataanálisis. Para valorar este resultado se calculó el número de seguridad de Rosenberg N (fs) = 97886, que representa a los estudios que no fueron publicados para que el sesgo de publicación deje de ser significativo (Botella y Sánchez-Meca, 2015).
El propósito de este estudio fue estimar la fiabilidad media de las puntuaciones combinadas de dos de las escalas más utilizadas en la evaluación de los mitos de violación, por el que se obtuvo un valor aproximado de su fiabilidad general y, además, identificar qué características de los estudios pueden explicar la heterogeneidad en sus coeficientes de fiabilidad presente en los estudios primarios. El coeficiente de fiabilidad medio para las 98 muestras incluidas en el estudio fue de .85 y el coeficiente medio para cada una de escalas IRMAS y AMMSA fue de .84 y .85 respectivamente. Todos estos valores se sitúan por sobre .80, valor establecido por Nunnally y Bernstein (1995) como una fiabilidad satisfactoria del instrumento para investigaciones en general. Por lo tanto, las medidas de aceptación de mitos de violación –tanto en la expresión clásica (IRMAS) como en la expresión moderna (AMMSA)– cumplen con los criterios de fiabilidad adecuados para ser utilizadas en investigaciones empíricas en las distintas condiciones consideradas en este estudio.
Los coeficientes alfa de Cronbach reportados por los estudios varían entre .71 a .98, valores considerados entre moderados a excelentes (Sánchez-Meca et al., 2016), lo que evidencia que las escalas mantienen índices de fiabilidad adecuados en las diferentes condiciones estudiadas. Estos resultados sugerirían que los instrumentos son fiables para la medición de la aceptación de mitos de violación a través de sus diferentes escalas y formas, en diversas culturas, tipos de muestras y diseños de investigación abordados en este estudio.
Respecto de la homogeneidad de los coeficientes de fiabilidad de los estudios, los resultados muestran que los coeficientes presentan una alta heterogeneidad. Por un lado, la prueba Q de Cochran llevó al rechazo de la hipótesis nula de que los coeficientes de fiabilidad de los estudios primarios están estimando un efecto paramétrico común (Badenes-Ribera et al., 2020), y por otro, el índice I. en torno al 96 % muestra que la mayor parte de la variabilidad no es debida al error muestral intraestudio (Huedo-Medina et al., 2006).
Según estos resultados, se realizaron análisis de moderadores para determinar cuáles de las variables consideradas en nuestro estudio podrían estar afectando los resultados de los índices de fiabilidad. Los resultados de los análisis de metarregresión muestran que la única variable cuantitativa que logra explicar significativamente la heterogeneidad de los resultados fue el número de ítems, que explica un 4.5 % de la varianza. Este resultado era esperable, dado que el efecto de la longitud del test en la estimación de los índices de fiabilidad tiene una larga tradición y es ampliamente conocido en la literatura psicométrica (Spearman, 1910).
Con relación a los moderadores categóricos, las comparaciones de medias mostraron que ninguna de las variables estudiadas muestra un efecto en la variabilidad de los coeficientes alfas de Cronbach examinados. Estos resultados sugieren que las diferencias observadas no son debido a las variables moderadoras consideradas en este estudio. A pesar de haber obtenido sesgo de publicación significativo –lo que sugiere ser cautelosos al interpretar los resultados–, el resultado del número de seguridad de Rosemberg muestra que los hallazgos de la investigación son estables y robustos (Botella y Sánchez-Meca, 2015).
Este trabajo presenta diversas limitaciones que pueden ser agrupar en tres niveles: las propias de los MA; las particulares a GF, y las limitaciones relativas al presente estudio. En primer lugar, es difícil estimar la cantidad de estudios que no se han publicado debido a que sus resultados no fueron significativos, lo que sin duda afecta la representatividad de los estudios primarios (Botella y Sánchez-Meca, 2015). Un segundo problema es el sesgo relativo a la calidad metodológica de los estudios. Esta limitación se abordó mediante la utilización de bases de datos reconocidas para la selección de investigaciones. Sin embargo, esto no asegura que la calidad de los estudios primarios sea homogénea entre las investigaciones incluidas (Borrego y Urbano, 2006).
En tercer lugar, se encontraron las limitaciones propias de los estudios de GF, entre las que se destacan: la falta de consenso con respecto a la pertinencia y necesidad de realizar ponderación de los coeficientes alfas de Cronbach (Botella y Sánchez-Meca, 2015), y la relativa a la heterogeneidad de las muestras de los estudios, lo que supone un sesgo debido al tipo de diseño utilizado y a la selección de la muestra, lo que implica un error en la medida con respecto al rango y distribución de la población (Botella et al., 2010).
Dentro de las limitaciones asociadas al presente estudio se puede aclarar que muchas de las investigaciones quedaron fuera del análisis por no reportar los coeficientes de confiabilidad del instrumento completo, por lo que el volumen de estudios analizados podría haber sido mayor si las investigaciones excluidas hubieran reportado las alfas de Cronbach de las escalas completas. Por otro lado, debido a que el gran volumen de investigaciones y la información reportada por cada estudio era muy diversa, dificultaba obtener variables comunes que limitó la incorporación de posibles variables moderadoras como, por ejemplo: orientación e identidad sexual, nivel de estudios de los participantes, actividad laboral, etcétera.
Para futuras líneas de investigación, sería interesante indagar mediante un MA los valores medios y varianzas de las puntuaciones muestrales de las escalas para estudiar la heterogeneidad, así como valorar si otras variables demográficas -como orientación e identidad sexual- son variables que podrían afectar los resultados de la consistencia interna. Además, la realización de un MA de correlaciones corregidas de los instrumentos que miden la aceptación de mitos de violación permitiría obtener evidencia acerca de la validez de las escalas (Botella y Sánchez-Meca, 2015).
Se puede concluir que las escalas más utilizadas en la medición de la aceptación de mitos de violación IRMAS y la escala AMMSA, a pesar de la alta heterogeneidad, presentan una fiabilidad por sobre los valores mínimos aceptados en todos los estudios primarios incluidos en el MA. Por lo tanto, son instrumentos adecuados para su uso en investigaciones empíricas, independiente de la escala, de la forma de los instrumentos –completa, reducida o libre–, en diferentes muestras, diseños de investigación y contextos culturales.
Finalmente, en los estudios de metaanálisis tradicionales se busca explicar las diferencias de los tamaños del efecto mediante variables moderadoras, lo que permite comprender las variables en estudio y definir nuevas líneas de investigación (Botella y Sánchez-Meca, 2015). Por el contrario, en los MA de GF se espera que la heterogeneidad no sea explicada por variables moderadoras, lo que evidencia que el instrumento es robusto y sólido en sus puntuaciones en los diferentes contextos (Botella et al., 2010).


Nota: K = número de estudios. QE = estadístico de contraste de la especificación del modelo. bj = coeficientes del modelo de regresión. zj = estadístico de contraste del coeficiente. p = nivel de significancia asociada a Z. QM = estadístico de contraste del moderador. R2 = proporción de la varianza explicada por la variable moderadora. * p < .05. ** p < .01. *** p < .001.


Nota: K = número de estudios. M = media de los α ponderados. IC95 % = Intervalo de confianza. QE = estadístico de contraste de la especificación del modelo. QM = estadístico de contraste del moderador. p = nivel de significancia. R2 = proporción de la varianza explicada por la variable moderadora. *** p < .001.