Resumen: En las siguientes páginas analizamos la disponibilidad léxica en español como lengua extranjera de una muestra de 82 estudiantes del grado en Filología Hispánica de la Universidad de Ulsan (Corea del Sur). El marco metodológico del presente trabajo parte de las bases establecidas por el Proyecto Panhispánico de Disponibilidad Léxica, dirigido por Humberto López Morales, si bien también sigue otras directrices aportadas por los trabajos realizados con no nativos. Para el estudio sociolingüístico fueron seleccionadas las variables “sexo”, “nivel sociocultural” y “conocimiento de otras lenguas”. Para el cálculo de los datos se utilizó el programa Dispolex.
Palabras clave:léxico disponibleléxico disponible,ELEELE,Corea del SurCorea del Sur,estudiantesestudiantes,universidaduniversidad.
Abstract: This paper analyzes the lexical availability in Spanish as a foreign language in a sample of 82 undergraduate students of the Spanish and Latin American Studies major at the University of Ulsan (South Korea). The methodology follows not only the principles of the Panhispanic Project of Lexical Availability, headed by Humberto López Morales, but the guidelines provided by other researches carried out with non natives speakers. For the sociolinguistics analysis, three variables were selected: ‘sex’, ‘sociocultural level’ and ‘knowledge of other languages’. The results were calculated using Dispolex program.
Keywords: lexical availability, SFL, South Korea, undergraduate students, university.
ARTÍCULOS
El léxico disponible de 82 estudiantes coreanos de español como lengua extranjera
The lexical availability of 82 undergraduate korean students of Spanish as foreign Language

Recepción: 22 Enero 2018
Publicación: 19 Febrero 2018
Jorge Daniel Mendoza Puertases licenciado y doctor en Filología Hispánica por la Universidad de Sevilla, cuenta con un máster en enseñanza de ELE por la Universidad Pablo de Olavide (Sevilla), también es licenciado en Estudios de Asia oriental y posee un posgrado en Arte y Sociedades de Asia oriental por la Universitat Oberta de Catalunya. Ha sido profesor en las universidades de Sevilla y Pablo de Olavide, en las que ha participado en distintos proyectos de investigación. Ha impartido clases en el máster Hispanic Language and Literature de la Universidad Nacional de Seúl. También ha enseñado español en diferentes programas y escuelas. Actualmente es profesor del Departamento de Español y Estudios Latinoamericanos de la Universidad de Ulsan en Corea de Sur, país donde colabora con el Instituto Cervantes como examinador del DELE en la ciudad de Daegu.
No cabe duda de que el vocabulario es una herramienta fundamental para comunicarnos con el mundo que nos rodea. Sin el conocimiento y el uso adecuado del vocabulario requerido para cada situación comunicativa, la comunicación no puede darse o resulta defectuosa. En consecuencia, el léxico constituye un elemento básico para el aprendizaje de cualquier idioma. En palabras de Ehlers (2009: 238-239), “el aprendiente que se intenta comunicar en una L2 tiene más posibilidades de tener éxito si usa las palabras adecuadas en una oración agramatical que a la inversa”. En este mismo sentido, como recuerda Higueras García (1996: 112), en la producción de cualquier hablante son los errores léxicos los que suelen dificultar la comprensión mientras que existe una mayor tolerancia ante los errores gramaticales. Es evidente que cuanto más amplio sea nuestro bagaje léxico mayor será el número de posibilidades que tendremos de comunicarnos airosamente. Por eso, al aprendiente de cualquier lengua extranjera “se le presenta el requisito acuciante de adquirir un vocabulario efectivo” que le sirva de “vehículo de comunicación con los hablantes nativos o no nativos de la lengua meta” (Pentcheva Karadjounkova, 2009: 70). Sin embargo, es conocido que el aprendizaje del léxico es un proceso no solo complejo sino lento cuyas dificultades teóricas, como apunta Higueras García (1996: 112), comienzan desde el mismo momento en el que se pretende precisar o definir el objeto de estudio. Es por ello que dos de las preguntas tradicionales que se han planteado los docentes de lenguas extranjeras han sido qué léxico hay que enseñar a los alumnos y cómo hacer la selección de dicho léxico. De uno u otro modo, estas cuestiones se encuentran en el origen de los estudios de disponibilidad léxica. Fue así como un conjunto de investigadores franceses, en la década de los 50 del pasado siglo, comenzó a trabajar en el establecimiento de un vocabulario básico que garantizara una formación sólida para los estudiantes de francés de niveles iniciales, sobre todo para aquellos alumnos de las antiguas colonias. Para la elaboración de este currículo y justificar la selección léxica partieron inicialmente del índice de frecuencia, ya que pensaban que aquellas palabras más habituales debían ser las primeras en enseñarse. Pero pronto advirtieron que ese criterio no resultaba tan útil como estimaron inicialmente, puesto que “en los listados de frecuencia o bien no figuraban palabras esenciales para poder comunicarse ─que además eran perfectamente conocidas por todos los hablantes─, o bien, cuando aparecían, lo hacían en posiciones muy retrasadas” (Paredes García, 2015: 3). Tal como señala Paredes García haciendo referencia al caso del español, la lista de las 30 unidades más frecuentes según el CREA son exclusivamente palabras gramaticales y algunos verbos copulativos y auxiliares de muy poco o nulo contenido semántico (ibíd.: 4). Resultaba evidente que el criterio de selección empleado debía ser otro. Se llegó a la conclusión de que todas aquellas palabras usuales referentes a realidades de la vida cotidiana que no aparecían en los listados de frecuencia presentaban un uso condicionado por el tema manejado en el discurso. Fue Michéa (1953) quien estableció una diferenciación entre las palabras frecuentes, a las que llamó “atemáticas”, y las que surgían vinculadas al tema de conversación o palabras “temáticas”. Estas últimas serán las palabras “disponibles” que busca la metodología de la disponibilidad léxica. Se caracterizan por aparecer rápidamente en la mente del sujeto cuando se le propone un tema determinado, de modo que para captarlas “se necesitan pruebas asociativas que estimulen el lexicón mental de los informantes y que estos produzcan esas palabras que están siempre disponibles, pero que solo aparecen cuando las circunstancias comunicativas lo exigen” (Bartol Hernández, 2006: 379). Por otro lado, ese léxico disponible, a diferencia del léxico frecuente que veíamos más arriba, se encuentra formado principalmente “por palabras con fuerte carga semántica: sustantivos, verbos y adjetivos” (Bartol Hernández, 2010: 91). Resumiendo, la disponibilidad léxica puede ser definida como “el caudal de vocabulario que puede aparecer cuando la situación comunicativa así lo requiere” (Sánchez-Saus Laserna, 2016: 21).
En el ámbito hispánico es bien conocido el trabajo pionero de H. López Morales (1973), a partir del cual los estudios léxicos basados en esta metodología han sido numerosos[1]. Como indica Bartol Hernández (2010: 91), desde los años 90 la disponibilidad léxica ha gozado de un gran desarrollo tanto cuantitativo como cualitativo. Cuantitativo, ya que los equipos de investigación surgidos han sido abundantes, y cualitativo en lo referente a reflexiones teóricas, desarrollos metodológicos y avance en las herramientas de análisis de los datos[2]. No en vano, en palabras de Sánchez Saus-Laserna, “es, sin duda, el español la lengua que mejor ha sabido aprovechar las ventajas de este nuevo método y aquella a la que más estudios sobre léxico disponible se han dedicado” (2016: 22). Por lo que el desarrollo actual de la disponibilidad léxica en el ámbito hispánico goza de un excelente estado de salud que posiblemente no sea comparable ni en cantidad ni en calidad al de ninguna otra lengua (Paredes García, 2012: 10; 2015: 5).
Si bien el arranque de los trabajos de disponibilidad léxica en español se produce en los años 70, sin embargo la aplicación de esta metodología al ámbito del español como lengua extranjera es bastante más reciente. No será hasta finales de los años 90 e inicios del presente siglo cuando se produzca una eclosión de este tipo de investigaciones. A través de ellas podemos comprobar cómo “las pruebas de producción léxica que se utilizan para captar el léxico disponible han demostrado ser muy útiles para medir el dominio léxico activo de los estudiantes de ELE” (Bartol Hernández, 2010: 103). Carcedo González (1998a, 1998b, 1999a, 1999b, 2000a) fue el pionero en aplicar esta metodología a estudiantes de español no nativos, concretamente con hablantes fineses. A partir de sus investigaciones, la producción científica en este ámbito ha ido aumentado de forma considerable. Así, en los últimos años han ido apareciendo numerosos trabajos centrados en estudiantes extranjeros de las más diversas nacionalidades. Entre ellos encontramos el de Hugo (2003), realizado con estudiantes alemanes de la región del Sarre; los de Lin (2006, 2012) e Hidalgo Gallardo (2017a), con alumnos chinos; el del López González (2009), con polacos; el de Šifrar Kalan (2011), con alumnos eslovenos; el de Magnúsdóttir (2012), con islandeses; los de Sandu (2012, 2014), con rumanos; el de González Fernández (2013), con estudiantes turcos; el de Zuccalà (2014), con estudiantes brasileños; el de Rubio Sánchez (2015), con aprendices italianos; los de Serfati (2015, 2016), con informantes marroquíes, así como algunos otros[3]. También se han llevado a cabo estudios comparados, como el de Šifrar Kalan (2009), donde se cotejan las investigaciones realizadas en Eslovenia, Salamanca y Finlandia; o el de Chen (2016), quien compara la disponibilidad léxica de estudiantes chinos y sudafricanos de ELE[4]. Por otro lado, en España se han llevado a cabo distintas investigaciones bien con grupos de alumnos extranjeros de nacionalidades heterogéneas, por ejemplo, Samper Hernández (2002), López Rivero (2008) y Sánchez-Saus Laserna (2011, 2016); bien con grupos de inmigrantes no hispanohablantes, como los trabajos de Jiménez Berrio (2013) y de Fernández-Merino Gutiérrez (2011, 2013)[5].
No obstante, a pesar de esta gran productividad, no conocemos ningún estudio sobre la disponibilidad léxica de los estudiantes coreanos de español como lengua extranjera. A este respecto, no podemos perder de vista que en los últimos años la sociedad coreana ha desarrollado un creciente interés por nuestro idioma. Así lo expresa la asesora cultural de la Embajada de España en Seúl:
En los últimos años se ha producido un cambio de tendencia en cuanto a las lenguas extranjeras escogidas por el estudiante coreano. Mientras que el inglés sigue siendo la lengua extranjera por excelencia, otras lenguas europeas como el francés o el alemán han ido perdiendo peso, siendo éstas últimas percibidas como poco útiles a nivel práctico. En el caso del idioma español, la creciente apertura de la economía coreana ha hecho posible que éste gane terreno siendo una de las lenguas occidentales más solicitadas en la enseñanza en Corea” (Hernández González, 2015: 5).
Este creciente interés por el estudio del español y el aumento consiguiente del número de estudiantes de ELE en la nación surcoreana (entre los examinadores del DELE es bien conocido el constante crecimiento de candidatos para este examen[6]) justifican sobradamente la realización de este trabajo.
El estudio que aquí presentamos se ha llevado a cabo en el seno del Departamento de Español y Estudios Latinoamericanos de la Universidad de Ulsan, en Corea del Sur. La muestra seleccionada se encuentra compuesta por un total de 82 alumnos de segundo curso del grado de Filología Hispánica. Debido al número de estudiantes de nuestra muestra este trabajo tan solo pretende ser una aproximación a la disponibilidad léxica de los estudiantes coreanos de ELE. La elección del segundo curso para realizar el muestreo se apoya en diversos motivos. Para empezar, los estudiantes de segundo curso, quienes suelen ingresar en la carrera sin ningún conocimiento de español, ya han entrado en contacto con la lengua y la han estudiado durante casi dos años. Puesto que la recogida de datos se realizó al final del segundo semestre, ya habían completado el nivel A2. Es en este curso, de acuerdo con el plan de estudios de la universidad, cuando el alumno puede decidir si va a realizar una estancia en el extranjero. Estas estancias oscilan normalmente entre los seis meses y un año, con un amplio abanico de países como destino. Ahora bien, este periodo de estudio del español fuera de Corea no es algo obligatorio, por lo que ciertos aprendientes optan por tener esta experiencia y otros no. De este modo, en los cursos de tercero y cuarto se multiplican las diferencias de nivel. Estas diferencias suelen depender, en primer lugar, de si el aprendiente ha realizado dicha estancia, lo que normalmente marca una diferencia cualitativa; en segundo lugar, del nivel que el estudiante adquirió en dicho periodo de estudios y, en tercer lugar, del tiempo que ha pasado entre dicha estancia y el presente[7]. A esto hay que añadir que el alumno puede inscribirse en estos últimos cursos aleatoriamente, es decir, no existe filtro de nivel ni de orden en su realización; por ejemplo, un estudiante puede cursar primero una clase de cuatro año y después otra de tercero, si así lo considera oportuno. Es evidente, que las diferencias de nivel en una sola clase pueden ser considerables. En consecuencia, el panorama de los cursos superiores resulta demasiado complejo para un primer acercamiento al objeto de estudio, así como los conocimientos del primer curso demasiado escasos para realizar prueba alguna. Por otro lado, para garantizar el análisis de acuerdo con los parámetros mencionados, dentro de la muestra elegida hemos descartado a aquellos estudiantes que, por motivos familiares, han sido residentes en cualquier país de lengua española, ya que su nivel, obviamente, no se corresponde con el del curso en el que se encuentran inscritos.
Continuando con el proceder de otros investigadores, este estudio parte de las pautas metodológicas del Proyecto Panhispánico de Estudio sobre Disponibilidad Léxica (PPHDL) dirigido por H. López Morales, aunque ha sido inevitable realizar ciertas adaptaciones de acuerdo con las características de nuestra muestra. A este respecto, las variables seleccionadas han quedado reducidas a tres: sexo, nivel sociocultural y conocimiento de otras lenguas. Cabe mencionar que a la hora de elegir las variables encontramos, por un lado, aquellas tradicionalmente usadas en el Proyecto Panhispánico y, por otro, aquellas específicas que han venido utilizándose en los trabajos realizados con estudiantes de español como lengua extranjera[8]. Las variables tradicionales referentes al tipo de centro o ubicación del centro no eran sencillamente aplicables al tipo de muestra aquí seleccionada, ya que el conjunto de los alumnos pertenece al mismo centro de carácter privado. Atendiendo a algunas de las variables empleadas en trabajos realizados con estudiantes de ELE, a saber, nivel de español, lengua materna, frecuencia de uso del español y conocimiento de otras lenguas[9]; las dos primeras fueron automáticamente descartadas, puesto que la muestra comparte un nivel de español similar y su lengua materna es la misma: el coreano[10].
En relación con los centros de interés, hemos mantenido los 16 centros tradicionales: 01. Partes del cuerpo, 02. La ropa, 03. Partes de la casa (sin muebles), 04. Los muebles de la casa, 05. Alimentos y bebidas, 06. Objetos colocados en la mesa para la comida, 07. La cocina y sus utensilios, 08. La escuela: muebles y materiales, 09. Iluminación, calefacción y medios de airear un recinto, 10. La ciudad, 11. El campo, 12. Medios de transporte, 13. Trabajos del campo y del jardín, 14. Los animales, 15. Juegos y distracciones, 16. Profesiones y oficios. Si bien a estos centros, como ya hizo Mateo García (1998) dentro de los estudios con nativos y otros investigadores como Serfati (2016) en los estudios con no nativos, hemos añadido un centro adicional 17. Los colores[11].
La encuesta que pasamos a los alumnos estaba formada por dos partes: la primera atendía a los datos personales de los encuestados y la segunda a los centros de interés elegidos. La parte inicial solicitaba información sobre las variables planteadas para el estudio: sexo, trabajo y estudios de los padres, conocimiento de otras lenguas más allá del coreano y el español, así como la frecuencia de uso del español. Para la frecuencia de uso del español respondieron a una serie de preguntas con las que pretendíamos determinar si lo usaban fuera de las clases y con qué asiduidad. De cualquier modo, debido a nuestro conocimiento sobre el perfil del estudiantado y debido a las limitaciones que ofrece la realidad coreana (especialmente en lo referente a intercambios reales con nativos), intuíamos la respuesta de la mayoría y la nula validez de esta variable. Por consiguiente, el presente estudio atiende exclusivamente a las tres variables citadas con anterioridad. De acuerdo con las mismas, cabe mencionar que, del total de los informantes, 33 eran hombres y 49 mujeres; 9 eran de nivel sociocultural bajo, 8 de nivel alto y 65 de nivel medio; 57 afirmaron conocer otras lenguas mientras que 25 señalaron que no conocían otros idiomas[12]. En relación con esta última variable, pensamos analizar los datos de acuerdo al número de lenguas conocidas por los informantes; ahora bien, los 57 que afirmaron conocer otras lenguas, tan solo conocían una: el inglés en 55 casos y el chino en dos casos. En consecuencia, la variable se centrará en el conocimiento o desconocimiento de otras lenguas, sin importar el número o filiación de la misma.
En la segunda parte de la encuesta se recogen los datos lingüísticos de acuerdo a una prueba de asociación controlada, en la que los núcleos de interés actúan como estímulos para que “el informante active los nodos de su lexicón mental y actualice aquellas palabras relacionadas con el estímulo” (Bartol Hernández, 2010: 91). En nuestro caso, a diferencia de la mayoría de los estudios realizados y de modo similar al procedimiento seguido por Sánchez-Saus Laserna (2016), no ofrecimos un listado impreso de los centros de interés sino que los fuimos anotando en la pizarra cuando los estudiantes debían empezar a escribir las palabras relacionadas con los mismos. De este modo, como apunta la anterior autora, se evita que los alumnos “piensen antes de tiempo palabras vinculadas a temas que se propondrán más tarde, con lo que nos aseguramos una mayor fiabilidad en las respuestas” (ibíd.: 40). Respecto al número de palabras, este no fue limitado sino que se trabajó con listas abiertas indicando a los estudiantes que podían anotar cuantas palabras quisieran. El tiempo se limitó a dos minutos por centro de interés.
Como es sabido, los datos recopilados en estas encuestas necesitan ser editados, y muy especialmente los de aquellos cuestionarios distribuidos entre estudiantes de ELE. No en vano, como afirma Samper Hernández (2002: 22, 23), “al tratarse de informantes no nativos, nos encontramos con fenómenos como la interferencia de la lengua materna de los hablantes o la semejanza de una unidad determinada a una palabra española sin llegar a pertenecer sin embargo a nuestro idioma”. Para la edición de los datos hemos seguido, por un lado, las directrices generales ofrecidas por Samper Padilla (1998) para el Proyecto Panhispánico y empleadas generalmente en todos los estudios de disponibilidad léxica y, por otro, aquellos criterios específicos para la investigación en LE ofrecidos por Samper Hernández (2002). Los criterios de edición tomados de Samper Padilla (1998) son: eliminación de los términos repetidos, corrección ortográfica, unificación ortográfica, neutralización de las variantes meramente flexivas[13], unificación de los derivados regulares, unificación de formas plenas y acortamientos, unificación de entradas formadas por varios elementos[14] y sus variantes acortadas, y el mantenimiento de las marcas comerciales lexicalizadas. Por otra parte, Samper Hernández (2002: 27-30) establece una serie de criterios relacionados con la corrección gráfica[15], el tratamiento de extranjerismos, la unificación en la presentación de las unidades y la amplitud de las relaciones asociativas, que también hemos tenido en cuenta en este trabajo.
Para el cálculo de los datos hemos usado el programa Dispolex que permite de manera gratuita extraer los índices cuantitativos más frecuentes vinculados a cada centro de interés, como el número de palabras totales, número de palabras diferentes o vocablos, número de palabras por persona, así como el índice de disponibilidad léxica de las unidades de cada centro. Del mismo modo, permite obtener los datos relativos a cada una de las variables tenidas en cuenta en el proyecto.
El número total de palabras obtenidas por los 82 encuestados asciende a 12405, lo que supone una media de 730 unidades por centro de interés y de 151 palabras por informante. Cada informante dispone de un promedio de 8,9 palabras por centro de interés. Este último dato se mueve dentro de los márgenes de las medias obtenidas en los trabajos realizados con no nativos, por ejemplo, Sánchez Saus-Laserna (2016), 14,46; Rubio Sánchez (2015), 13,13; López González (2009), 12,05; Samper Hernández (2002), 11,20; Lin (2006), 9,66; Sandu (2014), 9,37; Serfati (2016), 8,29; Fernández-Merino (2013), 8,25; Carcedo (1998a), 6,45; González Fernández (2013), 4,27; entre otros.
La siguiente tabla recoge una cuantificación del número total de palabras y de vocablos por centro de interés, así como el número de palabras por informante en cada uno de ellos. También se ofrece el índice de cohesión de cada uno de los centros.

De acuerdo con la tabla, los valores extremos relativos al número total de palabras por centro de interés son 1234 y 210, frente al número de vocablos cuyo valor más alto es 129 y el más bajo 15. Al igual que en otras muchas investigaciones (Carcedo González, 2000a, González Fernández, 2013; López González, 2009; Magnúsdóttir, 2012; Samper Hernández, 2002; Sánchez Saus-Laserna, 2016; Sandu, 2014; Šifrar Kalan, 2009, Zuccalà, 2014) “Alimentos y bebidas” es el ámbito nocional[16] donde nuestros encuestados aportan un mayor número de unidades, seguido de “Los animales”, “La ciudad”, “Profesiones y oficios” y “La escuela: muebles y materiales”. Por el contrario, y al igual que ocurre en los trabajos de Carcedo González (2000a), Samper Hernández (2002), López González (2009), Lin (2006, 2012), González Fernández (2013) y Sandu (2014) el menor número de unidades léxicas lo encontramos en el centro “Trabajos del campo y del jardín”, seguido de “Iluminación, calefacción y medios de airear un recinto”, “La cocina y sus utensilios”, “Objetos colocados en la mesa para la comida” y “Partes de la casa (sin muebles)”.
Como ocurre en todas las investigaciones sobre disponibilidad léxica y como puede inferirse de la tabla anterior, la posición relativa de cada centro suele diferir si atendemos al número de palabras totales y al número de palabras diferentes o número de vocablos. A este respecto, en la siguiente tabla ofrecemos una comparación entre los rangos alcanzados por cada centro de interés:

Como puede observarse, tan solo dos centros presentan el mismo rango de acuerdo a su número total de palabras y a su número de vocablos: “Objetos colocados en la mesa para la comida” (14) y “La escuela: muebles y materiales” (05). Por otro lado, llama la atención que centros muy productivos como “Los animales” (02) o bastante productivos como “Los colores” (06) alcanzan rangos considerablemente inferiores de acuerdo a su número de palabras diferentes, 7 y 15 respectivamente. Algo similar ocurre de manera inversa, es decir, que campos destacados por su número de vocablos, como “El campo” (01) o “Juegos y distracciones” (04), obtienen posiciones bastante más bajas respecto a su número de palabras: “El campo” (09), “Juegos y distracciones” (10).

El promedio de palabras por informante y centro de interés, y el número de palabras diferentes determinarán el índice de cohesión de cada centro[17], que es un indicador del grado de coincidencia en las respuestas. De acuerdo a esta mayor o menor coincidencia tendremos centros cerrados, cuanto más se aproxime dicho índice a 1, o abiertos cuanto más se acerque a 0. En nuestro estudio, el índice de cohesión medio es de 0,182. Este es mayor que el de otros trabajos, por ejemplo, Sánchez Saus-Laserna (2016), 0,032; Serfati (2016), 0,046; Sandu (2014), 0,048; López González (2009), 0,06; Fernández-Merino (2013), 0,064; Samper Hernández (2002), 0,105; Carcedo (1998a), 0,109 y Rubio Sánchez (2015), 0,135; lo que indica una menor dispersión en los centros. Las propias características de la muestra pueden ofrecer luz a este hecho: la pertenencia de todos los informantes al mismo nivel, así como el escaso contacto de estos con el español fuera del aula y su dificultad para adquirir vocabulario más allá de la enseñanza formal se concretan en una mayor homogeneidad del léxico disponible. Realizando un análisis más detallado, “Los colores” es el centro más compacto, con un índice de 0,43; seguido a cierta distancia de “Medios de transporte (0,34), de “Los animales” (0,22) y de “Partes del cuerpo” (0,22). Así pues, en estos campos el léxico compartido por los informantes ante un mismo estímulo es mayor. Ahora bien, si tenemos en cuenta el índice de cohesión medio, también se hallan por encima del mismo “Iluminación, calefacción y medios de airear un recinto” (0,21), “Partes de la casa (sin muebles)” (0,20), “Los muebles de la casa” (0,20) y “Objetos colocados en la mesa para la comida” (0,20). En el extremo opuesto, los centros más difusos o abiertos son, en primer lugar, “Trabajos del campo y del jardín” (0,05); en segundo lugar, “El campo” (0,07) y, en tercer lugar, “Juegos y distracciones” (0,08). En estos últimos, el léxico compartido es más bajo y existe una mayor dispersión en las respuestas. Abordando una comparación con otros estudios, nuestro campo más compacto, es decir, “Los colores”, también resulta ser el campo más cerrado de los trabajos de Sandu (2014) y Serfati (2016), mientras que “Trabajos del campo y el jardín” es igualmente el centro más difuso en las investigaciones de Samper Hernández (2002), López González (2009) y Sandu (2014).
En los resultados anteriores es posible apreciar, como exponía Hernández Muñoz (2006: 153, 154), que aquellos centros que suelen presentar mayores índices de cohesión pertenecen al grupo de las categorías que los estudios psicolingüísticos consideran como “naturales”. Entre ellos se situarían los núcleos temáticos “Medios de transporte”, “Los animales”, “Partes el cuerpo”, “Iluminación, calefacción y medios de airear un recinto”, “Partes de la casa (sin muebles)”, “Los muebles de la casa” y también podría incluirse el centro “Los colores”. Del mismo modo, entre las áreas temáticas con mayor cohesión se encuentran aquellas ad hoc, como “Objetos colocados en la mesa para la comida”. Mientras que aquellas áreas temáticas con menores índices de cohesión presentan estructuras radiales o relacionales, así ocurre con “El campo” y “Juegos y distracciones”, entre otros (íd.). El único centro que se distancia de lo expuesto es “Trabajos del campo y del jardín” que, a pesar de que su estructura interna es natural, por lo que sería esperable que fuera cerrado, se trata del centro más abierto. Lo que probablemente se relacione con la dificultad que encuentran los estudiantes en identificar conceptualmente este campo nocional (íd.).
Atendiendo a la variable sexo, cabe recordar que nuestra muestra se encontraba compuesta por 33 hombres y 49 mujeres, lo que constituye, el 40,2% y el 59,7% de la misma respectivamente. En esta investigación, al igual que en otros muchos trabajos sobre disponibilidad léxica[18], las mujeres presentan una mayor productividad que el grupo de los hombres. Aun cuando esta diferencia no es muy acusada, ya que el promedio de palabras por cada mujer es de 9,17 frente al promedio de 8,5 de los hombres, las mujeres aventajan en casi todos los centros a estos últimos. La mayor distancia en la productividad de ambos sexos se registra en el centro “Profesiones y oficios” donde las mujeres actualizaron 2,26 palabras más que los hombres. Como se ha indicado, la diferencia no es grande en cuanto al número de palabras por centro, e incluso los hombres registraron un promedio levemente superior en tres campos nocionales: “Partes de la casa (sin muebles)” (6,85/6,65), “Objetos colocados en la mesa para la comida” (5,76/5,45) y “Medios de transporte” (7,74/7,29).
En los vocablos, en cambio, las mujeres presentan un menor promedio por informante. Únicamente en el campo “Los muebles de la casa”, la media de vocablos de las mujeres es levemente superior a la de los hombres (0,90/0,91). Y en el centro número nueve el promedio es similar en ambos sexos (0,30/0,30). En el resto de los ámbitos nocionales, el grupo de los hombres presenta resultados superiores a los del grupo femenino. Podemos afirmar, por tanto, que las mujeres de nuestra muestra son más productivas, en cambio los hombres disponen de una mayor riqueza léxica.
Si nos fijamos en los resultados de determinados centros como “La ropa”, “Alimentos y bebidas”, “La cocina y sus utensilios” y “Medios de transporte”, estos podrían llevarnos a establecer una relación entre la productividad en determinadas áreas y los roles sociales típicamente desempeñados por ambos sexos (Sandu, 2014: 157). Es cierto que en los tres primeros centros las mujeres aventajan a los hombres (con mayor claridad en “Alimentos y bebidas” y “La cocina”) mientras que en “Medios de transporte” son estos últimos los que superan a las primeras. Sin embargo, también existen otros ámbitos, que pueden vincularse a estos roles, donde se produce el fenómeno inverso. Así se aprecia en “Partes de la casa”, donde la productividad femenina suele ser mayor (íd.) y son los hombres los que registran más unidades. También podría vincularse al rol social femenino el centro “Objetos colocados en la mesa para la comida”, en el que los hombres vuelven a sobresalir. Algo similar ocurre con los centros número nueve y trece (ibíd.: 159), pero a la inversa. Por lo que no consideramos que en nuestra muestra la productividad en ciertos campos pueda relacionarse claramente con la distribución tradicional de roles de género. Obviamente, esta relación tampoco se sostiene si nos centramos en el número de vocablos por informante.

Esta variable es la que presenta mayores diferencias en la representatividad de sus grupos. Recordemos que los informantes que componen el nivel alto son 8, y 9 los del nivel bajo, frente a los 65 del nivel medio. Esto supone un 9,7%, un 10,9% y un 79,2% de la muestra respectivamente.
Debido a esta notable diferencia entre grupos, el análisis de esta variable se centrará exclusivamente en el número de palabras por informante y no tendrá en cuenta el número de vocablos.
Los trabajos realizados con no nativos que incluyen esta variable registran un incremento en la producción de palabras conforme aumenta el nivel sociocultural, aun cuando este incremento pueda ser bastante reducido (González Fernández, 2013; López González, 2009; López Rivero, 2008; Rubio Sánchez, 2015). Ese incremento gradual suele observarse en el total de los datos, si bien, centrándonos en los distintos ámbitos nocionales, podemos encontrar ciertas áreas donde se manifieste ese incremento gradual y otras donde se dé el fenómeno inverso (González Fernández, 2013; López Rivero, 2008). En nuestro caso, dicho incremento se muestra de manera clara entre los tres niveles socioculturales. Si nos fijamos en los niveles alto y medio, el primero presenta un promedio de 12,4 palabras por informante y centro de interés, y el segundo, una media de 8,7. La diferencia entre ambos es considerable: 3,7 unidades. Atendiendo a los distintos ámbitos temáticos, el nivel alto presenta un mayor número de palabras por informante en todos ellos.

La distancia se reduce considerablemente entre el nivel medio y el nivel bajo. Así, teniendo en cuenta que el promedio de palabras por informante en el nivel bajo es de 7,2, existiría una diferencia de una palabra y media por estudiante y centro de interés entre ambos niveles. En una comparación detallada por núcleos temáticos, encontramos un centro donde el promedio de palabras por informante es superior en el nivel bajo, nos referimos a “Partes de la casa (sin muebles)” (6,45/6,56). Así como otros dos donde la diferencia entre ambos niveles es muy pequeña: “Alimentos y bebidas” (14,49/14,44) y “La ropa” (6,75/6,67).
Los datos arrojados por nuestra muestra parecen indicar una evidente influencia de la variable “nivel sociocultural” en la producción de palabras. Sin embargo, debido al importante desequilibrio de informantes entre los niveles alto y bajo, y el nivel medio, sería deseable observar los resultados que se alcanzaran en otro estudio llevado a cabo sobre una muestra más equilibrada a este respecto.

Del total de la muestra, 57 (69,5%) informantes dijeron conocer otra lengua frente a 25 (30,48%) que afirmaron no conocer ninguna. En esta variable la diferencia entre el número de estudiantes de ambos grupos también es considerable: aquellos que conocen otra lengua constituyen más del doble. Nos centraremos, por tanto, exclusivamente en el número de palabras por informante. Muchos de los trabajos realizados con no nativos establecen como variable el número de lenguas conocidas o incluso el conocimiento de otras lenguas románicas. Algo que, como explicamos más arriba, no era aplicable a nuestra muestra. Algunas investigaciones revelan una mayor productividad entre aquellos que conocen más lenguas (Fernández-Merino, 2013; González Fernández, 2013; López Rivero, 2008; Magnúsdóttir, 2012), demostrando la influencia de este aspecto[19]. Nuestro estudio puede incluirse dentro de esta tendencia, por cuanto los estudiantes conocedores de otra lengua registraron un mayor número de palabras que aquellos que no conocían ninguna otra más allá del coreano y el español. Así, el promedio de unidades por informante y centro de interés del primer grupo es de 9,5 frente a 7,4 unidades del segundo. Existe una diferencia aproximada de 2 palabras por estudiante y ámbito nocional. Si nos fijamos en la tabla que aportamos más abajo, podremos observar que los informantes que conocen otra lengua produjeron un mayor número de palabras en todos los centros.

En un análisis pormenorizado, el centro que presenta una mayor distancia entre ambos grupos es “La escuela: muebles y materiales”, en el que la diferencia es de 3,45 unidades. Por el contrario, “Trabajos del campo y el jardín” es el centro en el que la distancia es menor, tan solo 1,32 unidades. En este caso, la menor diferencia parece estar relacionada con la menor productividad de este campo; no en vano, ocupa el puesto 17. Por otro lado, muchos de los centros cuya productividad fue elevada presentan mayores diferencias entre grupos, lo que suele coincidir con una diferencia superior a dos unidades[20]: (1) “Alimentos y bebidas” (2,31), (2) “Los animales” (2,50), (3) “La ciudad” (2,35), (5) “La escuela: muebles y materiales” (3,45), (6) “Los colores” (2,49), (7) “Partes del cuerpo” (2,46), (8) “Los muebles de la casa” (2,26). El resto de los ámbitos, de menor productividad, presentan diferencias por debajo de dos unidades. Aunque existen excepciones, así los centros “Objetos colocados en el mesa para la comida” (2,21) y “La cocina y sus utensilios” (2,11), situados en los rangos 14 y 15 respectivamente, presentan una diferencia superior a dos palabras. De igual manera, pero en sentido opuesto, el centro “Profesiones y oficios” (1,45), cuya productividad lo sitúa en la cuarta posición, registra una diferencia por debajo de dos unidades.

Los resultados obtenidos y analizados previamente demuestran un claro influjo de la variable “conocimiento de otras lenguas” en la producción de palabras de nuestros encuestados.
¿Cuáles son las palabras más disponibles de nuestros informantes? Las siguientes veinte palabras son las que poseen un mayor índice de disponibilidad en nuestro estudio: cocina (0,7482), rojo (0,7453), plato (0,7274), ojo (0,7153), mesa (0,6997; 0,5769), cama (0,6949), silla (0,6638; 0,5922), autobús (0,6432), amarillo (0,6231), lápiz (0,5940), pantalón(es) (0,5934), sofá (0,5878), cuchara (0,5830), lámpara (0,5828), zapato (0,5825), cerveza (0,5825), bici(cleta) (0,5811), negro (0,5749). Los centros representados dentro de estas unidades son: “Partes de la casa (sin muebles)”, “Los colores”, “Objetos colocados en la mesa para la comida”, “Partes del cuerpo”, “La escuela (muebles y materiales)”, “Los muebles de la casa”, “Medios de transporte”, “La ropa”, “La cocina y sus utensilios”, “Iluminación, calefacción y medios de airear un recinto” y “Alimentos y bebidas”. Por el contrario, aquellos centros que quedan sin representación entre las 20 palabras más disponibles son: “La ciudad”, “El campo”, “Trabajos del campo y el jardín”, “Los animales”, “Juegos y distracciones” y “Profesiones y oficios”.
Una vez vistas las unidades más disponibles dentro del conjunto de palabras recopilado, ofreceremos un listado de las diez palabras con una mayor disponibilidad atendiendo a cada centro de interés:
01. Partes del cuerpo: ojo (0,7153), mano (0,5487), cabeza (0,4513), boca (0,4368), nariz (0,4260), pie (0,4202), cara (0,3089), pelo (0,2772), cuello (0,2272), piel (0,2104).
02. La ropa: pantalón(es) (0,5934), zapato (0,5825), camisa (0,5154), falda (0,4377), abrigo (0,3339), calcetín (0,2446), camiseta (0,2233), blusa (0,2185), chaqueta (0,2020), suéter (0,1653).
03. Partes de la casa (sin muebles): cocina (0,7482), (cuarto de) baño (0,5530), sala (0,4235), salón (0,3596), dormitorio (0,3307), comedor (0,2350), balcón (0,2069), recámara (0,1914), habitación (0,1825), jardín (0,1372).
04. Los muebles de la casa: cama (0,6949), silla (0,6638), sofá (0,5878), mesa (0,5769), tele(visión) (0,3267), lámpara (0,2116), sillón (0,1846), armario (0,1822), frigorífico (0,1696), mesilla (0,1515).
05. Alimentos y bebidas: cerveza (0,5825), agua (0,5295), leche (0,4248), vino (0,4041), arroz (0,3714), (carne de) pollo (0,3660), pescado (0,3550), manzana (0,3022), naranja (0,2921), carne (0,2898).
06. Objetos colocados en la mesa para la comida: plato (0,7274), cuchara (0,5248), copa (0,5239), vaso (0,4393), cuchillo (0,3345), tenedor (0,2913), taza (0,1865), palillos (0,1401), papel (0,1270), jarra (0,1007).
07. La cocina y sus utensilios: cuchara (0,5830), cuchillo (0,4317), plato (0,3699), frigorífico (0,2809), horno (0,2450), olla (0,2448), mesa (0,2115), copa (0,1757), vaso (0,1460), tenedor (0,1430).
08. La escuela (muebles y materiales): mesa (0,6997), lápiz (0,5940), silla (0,5922), bolí(grafo) (0,4946), libro (0,4479), goma (de borrar) (0,3444), computadora (0,3402), papel (0,2389), borrador (0,2131), ordenador (0,2113).
09. Iluminación, calefacción y medios de airear un recinto: lámpara (0,5828), aire acondicionado (0,5008), ventilador (0,3214), ventana (0,1847), calefacción (0,1777), luz (0,1520), sol (0,0585), vela (0,0504), bombilla (0,0324), fuego (0,0273).
10. La ciudad: coche (0,4158), universidad (0,3951), parque (0,3740), calle (0,3402), hospital (0,3299), mercado (0,3279), casa (0,3095), edificio (0,2907), autobús (0,2737), escuela (0,2674).
11. El campo: montaña (0,4767), árbol (0,4433), abuelo (0,3332), río (0,3104), arroz (0,1978), perro (0,1797), verdura (0,1444), caballo (0,1379), bosque (0,1255), pollo (0,1233).
12. Medios de transporte: autobús (0,6432), bici(cleta) (0,5811), coche (0,5093), taxi (0,4167), tren (0,4149), avión (0,3998), moto(cicleta) (0,3167), metro (0,2953), barco (0,2417), helicóptero (0,1124).
13. Trabajos del campo y el jardín: echar agua (0,2436), cortar (0,2281), plantar (0,2114), regar (0,0940), cultivar (0,0853), cuidar animales (0,0745), cortar árboles (0,0717), cortar arbustos (0,0627), dar de comer a los animales (0,0604), echar agua a las flores (0,0575).
14. Los animales: perro (0,5617), gato (0,5264), tigre (0,4575), hipopótamo (0,3649), león (0,3594), rinoceronte (0,3586), jirafa (0,3484), oso (0,2780), elefante (0,2747), camello (0,2572).
15. Juegos y distracciones: (ir al) cine (0,5225), (ver) películas (0,3405), (pasear por el) parque (0,2743), (leer) libros (0,2599), (ir a la) cafetería (0,2554), playa (0,2544), (jugar al) fútbol (0,2187), (subir a la) montaña (0,1753), teatro (0,1630), (escuchar) música (0,1584).
16. Profesiones y oficios: profesor (0,5509), bombero (0,5046), policía (0,3910), doctor (0,3725), abogado (0,3070), carpintero (0,2410), peluquero (0,2383), médico (0,2326), maestro (0,2301), arquitecto (0,1818).
17. Los colores: rojo (0,7453), amarillo (0,6231), negro (0,5749), azul (0,5215), verde (0,5000), blanco (0,4993), rosa (0,4794), marrón (0,3458), naranja (0,2848), violeta (0,2628).
No pretendemos abordar en este apartado un análisis exhaustivo de cada uno de los ámbitos nocionales, algo que superaría con creces las dimensiones propias de un artículo, sino ofrecer una breve panorámica de aquellos elementos más destacables para que sirva de orientación.
Uno de los aspectos más reseñables del léxico disponible de nuestros informantes es la presencia de unidades léxicas propias del español europeo y del español americano-mexicano[21]. Apreciándose, de este modo, la influencia ejercida por los dos profesores nativos del departamento. Pueden observarse parejas como: ordenador / computado-ra, rotulador / marcador, armario / clóset, jersey / suéter, dormitorio / recámara; bandeja, fuente / charola, plato / platillo, tiza / gis[22], pizarra / piza-rrón, pendiente / arete, discoteca / antro, coche / carro, melocotón / duraz-no, zumo / jugo, gamba / camarón, frigorífico / refrigerador, pijama / piya-ma, tenis / zapatilla de deporte, departamento / piso... Tan solo suele aparecer una de estas dos variantes en las listas aportadas por el informante, lo que puede indicar que el estudiante se ha decantado por una de estas dos formas, pero podría conocer ambas[23].
En un par de ocasiones, una pareja de estas variantes aparece entre las diez palabras más disponibles de un centro. Así ocurre en “Partes de la casa (sin muebles)”, donde encontramos tanto dormitorio en quinta posición como recámara en octava, y en “La escuela (muebles y materiales)”, donde computadora aparece como séptima palabra más disponible y ordenador como décima.
Aunque existen ejemplos de ambas normas en muchos centros de interés, en algunos de ellos, debido al volumen de palabras, puede apreciarse con mayor claridad esta influencia ejercida por los docentes. Entre las unidades registradas, también encontramos palabras que aluden a realidades relacionadas con cada uno de los países:
- Alimentos y bebidas: zumo, zumo de naranja, gamba, plátano, pincho, melocotón, paella, tapa, sangría, patata (España); elote, mole, durazno, banana, jugo, jugo de naranja, tequila, camarón[24], chile, taco, papa[25] (México).
- La ropa: sudadera, bañador, vaquero(s), jersey, chaqueta[26], pijama, pendiente, zapatillas de deporte (España); chamarra, suéter, playera, arete, tenis[27], traje de baño, piyama (México).
- La escuela (muebles y materiales): pizarra, rotulador, ordenador, tiza (España); pizarrón, marcador, computadora, gis (México).
- Medios de transporte: coche, AVE (España); Metrobús, trolebús, carro (México).
Por otro lado, no podemos olvidar, como afirmaba Mackey, que “la disponibilidad léxica es una medida de las diferencias culturales” (Mackey, 1971, apudCarcedo, 2000b: 177), ya que ciertas palabras “revelan diferencias de cultura y civilización” (Mackey, 1971, apudLópez Rivero, 2008: 16). Así, como ejemplifica López Rivero (íd.), aludiendo a un trabajo de Samper Padilla, Bellón y Samper Hernández:
“(…) el vocablo théâtre aparece en el tercer lugar en el vocabulario del centro ‘Las distracciones’ en Francia, mientras que en la región canadiense de Acadie, donde Mackey trabajó, desciende hasta el puesto número 242, y es el vocablo hockey el que ocupa la tercera posición”
En consecuencia, el léxico disponible de nuestros estudiantes reflejará elementos propios su trasfondo cultural y de su realidad más inmediata. Este hecho servirá para dar sentido al índice de disponibilidad de ciertas unidades en determinados ámbitos. No es de extrañar, por tanto, que entre las palabras más disponibles del centro “Alimentos y bebidas” se encuentre en primer lugar cerveza[28] (sin olvidar que se encuentra también en el grupo de las 20 unidades más disponibles) y en cuarto lugar vino, si tenemos en cuenta la importancia de las bebidas alcohólicas en la cultura coreana (Cho, 2013). Del mismo modo, varios informantes incluyeron en sus listas la palabra soju, la bebida alcohólica por excelencia de Corea, así como otras bebidas alcohólicas: tequila, vodka, whisky, sangría..., sin contar el hiperónimo alcohol. Tampoco es extraño que hallemos la palabra arroz[29] entre las diez más disponibles no solo en el ámbito de los “Alimentos y bebidas” sino también en “El campo”. La ancestral cultura coreana del arroz no solo convierte a ese cereal en un elemento básico de la dieta (Kim, 2016), sino que hace relacionar el ámbito rural con el cultivo del mismo. Corroborando este hecho, en el centro de “Trabajos del campo y el jardín” aparecen unidades como plantar arroz o echar agua al arroz en las posiciones 13 y 21 respectivamente. Volviendo al ámbito de “Alimentos y bebidas”, estrechamente vinculadas con su tradición gastronómica se encuentran unidades como kimchi o tofu.
Por clara influencia cultural, la palabra palillos se encuentra entre las diez unidades con mayor disponibilidad del centro “Objetos colocados en la mesa para la comida”. Lo que llama la atención es que por encima de ella se encuentren palabras como cuchillo y tenedor (no así cuchara, cuya presencia es constante en la mesa debido a la importancia de la sopa en la gastronomía coreana), unidades que, quizás, hayan sido recordadas con anterioridad por los estudiantes al asociar la encuesta a la clase de español y a los elementos relacionados con su cultura. Si avanzamos un poco entre las unidades más disponibles de este centro, encontramos tijera(s) como la decimotercera de ellas. La presencia de unas tijeras no sería algo muy frecuente en una mesa occidental, pero sí lo es en Corea, donde se usan tanto en la barbacoa coreana como para cortar ciertos tipos de fideos así como en otros platos.
Si más arriba comentábamos que arroz se encuentra entre las unidades más disponibles del centro “El campo”, la palabra más disponible de este ámbito nocional es montaña [30]. No en vano, como apuntaba Carcedo González (2000c), “el marco físico concreto en el que se desenvuelve habitualmente la vida del hablante —con sus posibilidades y limitaciones— también aflorará en mayor o menor medida en la expresión lingüística”. A este respecto, hay que aludir a la orografía de la península coreana, en la que se estima que en torno al 80% de su superficie es de carácter montañoso debido a la gran dorsal Taebaek. La idea de “campo” queda por tanto asociada a la palabra montaña en el lexicón mental de nuestros aprendientes. También bosque aparece entre las diez palabras más disponibles de este ámbito. No en vano, muchas de estas montañas se encuentran cubiertas de árboles: se estima que un 60% de la superficie del país es boscosa. Por lo que los informantes pudieron establecer una clara vinculación entre el campo nocional y la palabra. En esta misma línea, (subir a la) montaña se encuentra entre las unidades más disponibles del núcleo “Juegos y distracciones”, ya que el senderismo, por estas zonas verdes y montañosas, es una afición muy extendida entre todas las edades. Por otro lado, resulta curioso que en el mencionado centro “El campo” la tercera palabra más disponible sea abuelo, que aparece tanto en masculino como en femenino. Es la palabra empleada por nuestros informantes para referirse a la población de avanzada edad que sigue viviendo las zonas rurales frente a la mayoría de la población joven y de mediana edad que se agolpa en los principales núcleos urbanos del país. Muchos de los abuelos de nuestros informantes viven en ese campo al que alude el área nocional en cuestión, por lo que la asociación es notoria.
En las páginas previas hemos analizado el léxico disponible de 82 estudiantes coreanos de ELE de nivel universitario. El análisis de los datos recopilados en esta investigación revela, por una parte, una mayor productividad en las mujeres frente a una mayor riqueza léxica en los hombres. Por otro lado, se observa un incremento en la producción de palabras conforme aumenta el nivel sociocultural de los encuestados. Aunque esta información, debido a la evidente desigualdad en la representación de los distintos niveles, sería deseable poder contrastarla con la de otros trabajos futuros. Por su parte, la variable “conocimiento de otras lenguas” parece ejercer una clara influencia en la productividad de nuestros informantes. Respecto al número de palabras recogidas en los distintos campos nocionales, la presente investigación sigue la tendencia de los trabajos consultados en relación con los centros más y menos productivos. Como hemos visto, el centro “Alimentos y bebidas” encabeza la lista y “Trabajos del campo y el jardín” la cierra.
Si bien en otras investigaciones existe un claro predominio del léxico característico del español peninsular[31], en nuestro análisis cualitativo hemos observado bastantes unidades de otra procedencia diatópica. De este modo, en la disponibilidad léxica de nuestros informantes se aprecia una alternancia entre formas del español europeo y otras propias del español americano-mexicano. En este sentido, cabe apuntar que, aun cuando no hemos cuantificado el número de palabras correspondiente a cada una de las normas, es evidente que existe una clara representación de unidades léxicas diferenciadoras de las dos diatopías. Este hecho surge como resultado del input ofrecido por los dos profesores nativos del departamento, a saber, un español y una mexicana.
Por otra parte, también hemos constatado que tanto la realidad inmediata de nuestros informantes como su trasfondo cultural han dejado una huella claramente perceptible entre las unidades léxicas de los distintos ámbitos. Algunas de las cuales se encuentran entre las palabras más disponibles de diversos centros.







