Resumen: Este artículo tiene por objeto abogar por la incorporación de las relaciones de sucesos como fuente para los estudios en lingüística histórica, en concreto, en las investigaciones sobre léxico. Para ello se repasa la consolidada relación entre historia de la lengua e historia de la lengua literaria, vínculo que particularmente se observa en el español del Siglo de Oro, así como la pervivencia de esta tendencia en los corpus diacrónicos de la Real Academia Española (CORDE y CDH), donde el número de relaciones de sucesos es limitado. Se destacan, asimismo, algunos de los problemas asociados con la información bibliográfica y la edición de las relaciones de sucesos presentes en estos corpus y, además, se ilustra cómo estos textos pueden cubrir las lagunas de documentación acerca de las voces extranjeras introducidas en lengua española. Se realizan, por último, unas consideraciones para lograr un modelo digital común útil no solo para historiadores de la lengua, sino para especialistas de otras disciplinas.
Palabras clave:Historia de la lengua españolaHistoria de la lengua española,historia del léxicohistoria del léxico,relaciones de sucesosrelaciones de sucesos,corpus electrónicoscorpus electrónicos,edición y transcripciónedición y transcripción.
Abstract: This article argues for the inclusion of the news pamphlets as a source for studies on historical linguistics, specifically for research on vocabulary. For this purpose, this work reviews the established relation between the history of language and the history of literature, particularly in the Spanish Golden Age, as well as the prevalence of this trend in the Real Academia Española diachronic corpora (CORDE and CDH), where the number of news pamphlets included is limited. Moreover, this work first highlights some of the problems associated with the bibliographical information and the edition of the news pamphlets in these corpora and, second, illustrates how this textual tradition contributes to fill the gaps in data concerning loanwords in the Spanish language. Finally, this work presents suggestions to attain a common and useful digital model not only for language historians, but specialists from other fields.
Keywords: History of the Spanish language, History of vocabulary, News pamphlets, Electronic corpora, Edition and transcription.
Artículos
Relaciones de sucesos, corpus digitales y extranjerismos*
News Pamphlets, Digital Corpora and Loanwords
Recepción: 30/09/2020
Aprobación: 25/11/2020
En los últimos años, el análisis de las relaciones de sucesos se ha abordado desde ámbitos como la literatura, el periodismo, la bibliografía y la historia de la imprenta. Si bien las relaciones comienzan a explotarse como fuente en los estudios lingüísticos, los trabajos realizados hasta el momento se han centrado, principalmente, en la vertiente discursiva y pragmática1; sin embargo, son todavía escasos los estudios que toman las relaciones de sucesos como punto de partida para las investigaciones sobre el léxico2, en particular, los extranjerismos3. De modo que su utilidad como fuente para el estudio histórico de la lengua todavía no ha despertado el interés que cabría esperar de estos impresos menores, pero con un impacto masivo.
El escaso repertorio de fuentes empleadas en la construcción de la historia de la lengua española ha sido cuestionado durante las últimas décadas, puesto que tradicionalmente se ha entendido como texto de la historia del español solo el literario. Sobre ello se ha manifestado Pato4, que determinó los autores más citados en los trabajos de corte diacrónico para los periodos medieval y clásico. Asimismo, en referencia a la etapa clásica, Octavio de Toledo y Huerta ha destacado el contraste cuantitativo entre la mención de autores del siglo XVI y el XVII5. La equiparación entre lengua y lengua literaria en la lingüística hispánica, como expone Cano Aguilar6, se originó en la obra de Menéndez Pidal y, aunque este criterio se ha ido matizando en los últimos años, todavía pervive en relación con la lengua áurea.
A esta idea se suman los problemas metodológicos, pues al pequeño conjunto de textos analizados se añaden las dificultades introducidas en los corpus académicos de carácter diacrónico, en especial, CORDE, donde se presentan las ediciones críticas de los textos, modernizadas siglos después sin indicarlo de forma clara, así como cabeceras bibliográficas no siempre precisas. Aunque paulatinamente se extiende la preocupación por la calidad de los datos, porque CDH soluciona algunos de los inconvenientes de CORDE, difícilmente se supera la mediatización por el canon literario. Por lo que cabe reconsiderar qué papel se ha otorgado a las relaciones de sucesos, es decir, a los «textos tan sumamente no canónicos», retomando las palabras de Ettinghausen7, dentro del conjunto de documentos para el estudio de la historia del español.
Se centra este trabajo en destacar por qué deberían incorporarse al estudio del léxico desde una perspectiva diacrónica. Así, partiendo del estado textual y bibliográfico de las relaciones de sucesos en este corpus académico (§ 2), se definen qué nuevas vías se abren y se ilustra qué resultados se alteran si se introducen las relaciones bien separadamente, bien juntamente con otras fuentes entre los parámetros de los análisis (§ 3). Finalmente, se realizan unas propuestas para estandarizar la explotación de estos impresos (§ 4). En suma, el objetivo de este trabajo es mostrar la utilidad de las relaciones de sucesos como fuente para el estudio de la historia de la lengua, en especial, del léxico.
Con propósito ilustrativo, me referiré solo al Corpus Diacrónico del Español (CORDE), puesto que contamos con muy pocas relaciones en él. Extraña, por tanto, que en la nómina de fuentes se haya diseñado una categoría denominada «Historia y documentos: cartas y relaciones», pues la proporción de unas y otras dista de estar equilibrada —menos de doscientas relaciones de sucesos frente al resto de cartas, cédulas, estatutos, minutas, peticiones, pregones, romances, testamentos, tratados y otro tipo de documentos hasta alcanzar los cuatro mil cuarenta englobados bajo este epígrafe8—.
Asimismo, como sucede con el grueso de los textos volcados en este corpus, no se trata de una transcripción de los originales, sino de una edición publicada siglos después. Por ejemplo, de Andrés de Almansa y Mendoza se incluyen siete relaciones —cuatro datadas en 1623, dos en 1624 y una en 1622—, mas se trata del texto editado en 1982 por José Simón Díaz, de cuya obra, Relaciones breves de actos públicos celebrados en Madrid de 1541 a 1650, se extraen ciento cincuenta textos, lo que supone el 94 % de las relaciones de sucesos presentes en CORDE9.
En una reseña escrita por Francis Cerdan el mismo año que se publica esta obra se criticaba lo siguiente:
[…] podemos lamentar, en cambio, que no se nos den en esta introducción, los criterios de la transcripción de los textos, que quedan algo imprecisos. Suponemos que en la mayoría de los casos, el recopilador los publica tal como se presentan, señalando a veces por un sic manifiestos errores; pero otras veces hay evidentes corrupciones no señaladas. No hablemos de las erratas y de algunos descuidos en la impresión, como por ejemplo en las páginas 284 y 408, en las que se cierran paréntesis que nunca llegaron a abrirse10.
Así pues, no contamos con los criterios de transcripción del texto, pero sí, como señala Cerdan, con numerosas corrupciones, erratas y descuidos. No es exclusivo de las relaciones de sucesos integradas en CORDE, ya que afecta a los textos de todas las épocas, no en vano Rodríguez Molina y Octavio de Toledo y Huerta diseñaron el CORDEMÁFORO11. Abre, por consiguiente, el mismo interrogante acerca de la construcción de este corpus: por qué se eligen unas ediciones en lugar de otras y qué criterios se aplican para tomar esta decisión.
En cuanto a la calidad del texto, queda de manifiesto que es dudosa; sin embargo, aquí no terminan los defectos. Expone Cerdan que las relaciones anónimas se estudian en conjunto en la obra de Simón Díaz: «en cuanto a los “anónimos”, hay varias constantes muy bien presentadas y estudiadas en un apartado especial»12. Ciento tres de las relaciones volcadas en CORDE figuran como anónimas tomando como referencia este apartado, mas sucede que parte de ellas podrían no serlo. Por ejemplo, la referenciada en CORDE como Relación de la embajada del duque de Umena fue escrita, según la asignación que figura en el Catálogo y Biblioteca Digital de Relaciones de Sucesos (CBDRS), por Juan Bautista Villanueva13. Lo mismo sucede con la Relación de los funerales por la reina doña Margarita de Austria, de Juan Gómez de Mora14.
Se presentan, por una parte, problemas derivados de las transcripciones de los textos y, por otra, asignaciones de autoría y anonimia carentes de precisión. Así las cosas, tampoco algunas dataciones son exactas. Es necesario señalar que las dataciones se clasifican en CORDE bien como «fecha de escritura», bien como «primera edición», aunque este último criterio se utiliza menos que el primero. Pero intentar establecer esta distinción puede generar confusión. Como no se especifican los ejemplares en los que se han basado las transcripciones, sería prudente cerciorarse si corresponden a la primera edición, si han salido de las imprentas ediciones previas o si se han publicado simultáneamente por diferentes impresores. Por tanto, es razonable que, como se pone de manifiesto en la nómina de relaciones, este criterio de clasificación se utilice con mesura.
Con respecto a la «fecha de escritura», que constituye la clasificación mayoritaria, el criterio resulta muy laxo, porque no puede determinarse con seguridad cuándo se escriben estos textos. Las cartas cuentan con la ventaja de ir fechadas; pero en las relaciones de sucesos, aunque presumiblemente se escriben después del suceso, nada obsta para que se escriban o se retomen meses o años después. Por ello supondría un avance que se especificase a qué ejemplar corresponde la transcripción del texto volcado, dado que en el corpus académico se determina que la fecha del acontecimiento es, también, la de escritura, y solo en pocos casos se matiza añadiendo a., ante, o c., circa.
Puede trazarse la correspondencia con facilidad en algunos textos, pero no es así en otros. Como algunas de las transcripciones utilizadas en CORDE son accesibles en internet, su rastreo nos brinda este dato. Así, en Verdadera relación del duque de Guisa (impresa por Gabriel Ribas en 1588), la edición del texto volcada, según la información proporcionada en CORDE, es la elaborada por Ali Hassan Ali Ahmed en 199915. En la web en la que se aloja el trabajo16, se especifica: «para esta edición se ha utilizado el ejemplar catalogado como n.º 251 de la Biblioteca Universitaria [de] Murcia».
Si nos detenemos en los criterios de edición esbozados, se advierte que «para facilitar su comprensión, se ha modernizado la puntuación». Dejando a un lado que es discutible, pues la puntuación también refleja la evolución de lo que se consideraba en cada etapa histórica un periodo oracional, no se menciona que se ha modernizado también la acentuación:
[…] se ha intentado reflejar al máximo el texto original. Sin embargo, para facilitar su comprensión, se ha modernizado la puntuación. En cuanto a las grafías, sólo se ha modificado el empleo de u y v y de i y j, que se han distribuido según tengan valor vocálico o consonántico, y el signo tironiano (que corresponde ala conjunción et), se ha sustituido por e, puesto que siempre aparece ante i.
Aunque el texto volcado en CORDE se atribuye a Ali Hassan Ali Ahmed, ha sido modificado. De ahí que los acentos gráficos introducidos se hayan suprimido en la versión del corpus académico. En consecuencia, ¿se pretende que por eliminar las tildes una presentación crítica se transforme en una transcripción paleográfica? Asimismo, en el texto accesible, «la cavallería de monsiur» se transforma en «la cavalleria de montar», «el señor de Aumela» en «el señor de Dumela» o «assaltaron el dicho lugar, que serían las siete bien de la tarde, sin hallar quien les contradixesse la entrada» en «assaltaron el dicho lugar que serian las siete bien de la tarde, sin quien les contradixesse la entrada», suprimiendo aquí una coma y un verbo.
La transcripción del texto realizada por Antonio Solano Cazorla en 1998 coincide en este punto con la de Ali Hassan Ali Ahmed y difiere de la recogida en CORDE: «assaltaron el dicho lugar q[ue] serian las siete bien de la tarde, sin hallar quien les co[n]tradixesse la entrada»17. Sin embargo, en ciertos pasajes los tres textos difieren entre sí, por ejemplo, se pasa de quemar las casas . quedar las cosas:
«de tal manera q[ue] quemaron las casas» (Antonio Solano Cazorla)
«de tal manera que quedaron las casas» (Ali Hassan Ali Ahmed)
«de tal manera que quedaron las cosas» (CORDE)
Se llega en la versión de CORDE a suprimir partes del texto, así como a combinar elementos de las dos transcripciones previas:
[…] esta fue causa que el Duque luego por la mañana partio con toda su gente y fue alojar a su casa de Cortenay, adonde reposaro[n] todo el dia del Domingo, porq[ue] la gente se pudiesse alli bie[n] rehazer, y tomar refresco. Lunes luego se resolvio el Duque partirse con los señores d[e] Aumela, y del Buef (Antonio Solano Cazorla).
[…] esta fue causa que el Duque luego por la mañana partió con toda su gente y fue alojar a su casa de Lortensy, adonde reposaron todo el día del Domingo, porque la gente se pudiesse allí bien rehazer, y tomar refresco. Lunes luego, se resolvió el Duque partirse con los señores de Aumela y del Buef (Ali Hassan Ali Ahmed).
[…] esta fue causa que el Duque luego por la mañana partio con toda su gente y fue alojar a su casa de Lortensy, adonde reposaron todo el dia del Domingo. Lunes luego se resolvio el Duque partirse con los señores de Aumela, y del Buef (CORDE).
Courtenay, Cortenay en la transcripción de Solano Cazorla, se convierte en Lortensy en las dos siguientes. El fragmento «porque la gente se pudiesse allí bien rehazer, y tomar refresco» desaparece. Asimismo, la coma antes de la conjunción copulativa final no figura en la edición de Ali Hassan Ali Ahmed, pero sí en la de Solano Cazorla18. ¿Qué texto se ha volcado? Si se trata de un texto reelaborado a partir de una transcripción previa debería indicarse, así como cualquier modificación atribuible al procesamiento masivo de textos por medios electrónicos, aunque solo fuera por descargar de errores a los responsables anteriores de las transcripciones.
Se ha señalado en varias ocasiones el problema derivado de tratar de analizar los textos de la historia del español por sus ediciones críticas. En primer lugar, por muy respetuosa que haya sido la intervención del editor con respecto al texto original, pocas ediciones se libran de la modernización rasa de la grafía original, lo que arrastra consigo datos relevantes. Los historiadores de la lengua estamos inmersos, como se denomina en Campos Souto y Pascual en «la sospecha metódica» ante los datos individuales sin correlato19, pero esto no tendría por qué ser así con carácter general, dado que a los corpus se les presupone fiabilidad. Aunque la desconfianza acerca de la información sea dominante entre los especialistas, ¿qué ocurre con los estudiosos de otros ámbitos que emplean el corpus? ¿la consulta les obliga también a cotejar los documentos o tienen que conformarse con los datos proporcionados aunque sean poco fiables?
Como se relata en Campos Souto y Pascual, un desliz en el texto de una edición crítica volcado en CORDE ha llevado al cotejo de una decena de documentos para resolver el primer testimonio de una voz20. Es la edición de una carta de relación de Hernán Cortés la que ofrece una documentación temprana y aislada de la voz sable y, por tanto, sospechosa de deberse a un error de lectura o de transcripción. Se resuelve ser dalle en vez de sable, forma que coincide, como ponen de relieve los investigadores, con la lectura de la relación impresa por Jacobo Cromberger en Sevilla 152321.
Dejando a un lado la cronología de las documentaciones, atendiendo a la representatividad, está en la génesis del corpus diacrónico académico no centrarse en la lengua literaria, puesto que, como afirman Sánchez Sánchez y Domínguez Cintas, «pretende ser un corpus representativo»22. La representatividad, como explica Kabatek, es un concepto sociológico de difícil aplicación en el ámbito lingüístico, más todavía en la lingüística diacrónica23. De ahí que no se pueda aplicar a la lengua; no obstante, se aplica.
Según los porcentajes desglosados en Sánchez Sánchez y Domínguez Cintas, los textos literarios del CORDE suponen el 44 % y los no literarios el 56 %. De este 56 %, un 9 % le corresponde a la historia y un 3 % a la prensa24, lo que contrasta con el porcentaje asignado a esta última categoría en CORPES XXI (Corpus del Español del Siglo XXI); en la actualidad son 300.795 los documentos incorporados en su última versión (CORPES XXI 0.92, publicada en mayo de 2020), de los cuales 275.528 se engloban bajo el subcorpus de prensa, lo que representa el 92 % del total.
Los textos correspondientes a los Siglos de Oro en CORDE, separados en dos periodos (1492-1598 y 1599-1712), conforman el 30,5 % como se apunta en Sánchez Sánchez y Domínguez Cintas25. De este porcentaje, según mi cálculo, las relaciones impresas en pliegos sueltos solo suman el 1,4 %, puesto que las relaciones consignadas bajo la categoría «Prensa» son relaciones manuscritas26. Si nos ceñimos en exclusiva a la segunda etapa definida en el corpus, que abarca el siglo XVII, momento que coincide con el auge de la publicación de estos impresos, el porcentaje sube a 3,6 %27. Se trata de un porcentaje minúsculo teniendo en cuenta que muchas imprentas subsistían gracias a las relaciones de sucesos28, porque suponían una de sus mayores fuentes de ingresos. Su peso en CORDE se ha reducido enormemente, lo que, en primer lugar, se ajusta poco a la realidad de la circulación de los textos en esa época, por tanto, a la caracterización de la lengua, y, en segundo lugar, es poco «representativo»29.
Basándome en los principios que rigieron la construcción del CORDE, si tenemos en cuenta lo expuesto por Sánchez Sánchez y Domínguez Cintas en relación con los textos, «se han elegido aquellos considerados más representativos debido a su difusión»30, pocos impresos más difundidos que las relaciones de sucesos. Si se han seleccionado debido «a su influencia en obras posteriores o al uso que de ellos se ha hecho como apoyo de autoridad en otras obras», los mecanismos lingüísticos empleados en las relaciones de sucesos daban el salto a los más diversos géneros, pues eran fuente de consulta para la elaboración de otras obras. Se apunta que «otro de los aspectos en el que se ha puesto especial cuidado ha sido la dimensión lingüística del texto, la riqueza de vocabulario y su carácter divulgativo». Dimensión lingüística, sí; riqueza de vocabulario, también —puesto que reflejan innovaciones léxicas, en particular, la introducción y difusión de extranjerismos y neologismos—, y al carácter divulgativo exigido podemos sumar no solo la información, sino también el entretenimiento.
Los intentos por vincular las relaciones de sucesos con el estudio histórico del léxico son todavía escasos. Como apunta Iraceburu Jiménez, estamos ante «una documentación ignorada desde la perspectiva lingüística»31 y «entre las numerosas vías que se abren en el escrutinio filológico de estos pliegos resulta de especial interés el estudio de aquellos términos adoptados de otras lenguas, como el portugués, el francés o el italiano»32.
Con todo, quedan todavía muchas lenguas por analizar en la literatura informativa de los siglos XVI y XVII, pues son numerosas las voces de origen chino, japonés o turco que se introducen en el caudal léxico del español a través de las relaciones de sucesos. Puesto que los vocablos de origen galo, italiano o luso son los que han recibido tradicionalmente más atención en la construcción de la historia del español y, por tanto, los que han configurado hasta ahora nuestra imagen de la lengua áurea, dirigiré la atención hacia las lenguas infrarrepresentadas en manuales, estudios y diccionarios.
La inclusión de las relaciones de sucesos como fuente en los estudios diacrónicos es necesaria, pues suelen conformar la primera documentación de extranjerismos33. Pocos datos gozan de más relevancia que la datación en la perspectiva diacrónica, por lo que su consulta es, para el estudio histórico y etimológico, obligada34. Mas no se trata solo de este aspecto, también las variantes gráfico-fonéticas y morfo-fonéticas registradas suponen una de las principales vías para el conocimiento del vocabulario empleado, en particular, durante el siglo XVII, y si este gozó o no de continuación en los siglos posteriores. La historia de la lengua, de la escritura y de la imprenta confluyen en este punto, pues fue esta última la que influyó notablemente en los usos gráficos y perpetuó formas que poco probablemente pueden hallarse fuera de los impresos menores o en los textos que tomaron estos como fuente.
Las variantes afectan a los nombres comunes y a los propios, en especial, a la toponimia. Ahora que comienza a combinarse la transcripción de los textos con la georreferenciación, el registro de las variantes abre una nueva forma de acercarse tanto al léxico común como a la localización de los lugares mencionados. No es, en consecuencia, un asunto baladí que pueda despacharse estandarizando las grafías. A propósito de este tema, es necesario subrayar que la relación de sucesos como hipotexto de otra obra se torna visible, en ocasiones, no por elementos estructurales o temáticos, sino por el empleo de ciertos ítems léxicos y la grafía utilizada.
Se ha observado que en los adjetivos no recae la novedad lingüística de estos textos y sus títulos, pues son calificativos antepuestos, concatenados, que tienden a la fórmula35; sin embargo, la nómina de sustantivos registra mayor innovación, tanto en forma de neologismos como de extranjerismos. No implica que no se contemplen otros procesos, como la ampliación semántica, sino simplemente que me centraré aquí en el estudio de extranjerismos formales para aclarar qué consecuencias se derivan de que los corpus académicos apenas hayan incluido relaciones de sucesos de los siglos XVI y XVII en su nómina de obras.
Dado que mis investigaciones se han centrado en las voces japonesas, para la que apenas se halla documentación en CORDE, pero sí en los cientos de cartas y relaciones que se escribieron con motivo de las misiones religiosas y el comercio establecido con los países de Asia Oriental, proporcionaré aquí un ejemplo diferente. La voz palanquín, para la que no se ofrece étimo último en el DRAE, sino la siguiente información: «del port. palanquim», es un caso paradigmático, pues se trata en Verdonk36 en la subcategoría de «orientalismos». Subcategoría porque, además de depender en la jerarquía de la categoría de lusismos, se mezclan en ella voces de diferentes lenguas asiáticas37.
Palanquín, en su acepción de «especie de andas usadas en Oriente para llevar en ellas a las personas importantes» (DRAE, s. v. palanquín 2), según CORDE, se documenta en su forma sin acentuar (palanquin) circa 1618 en los Comentarios de García de Silva y Figueroa («un andor ó palanquin de los de la India», p. II, 19)38. Sin embargo, el término se atestigua décadas antes, en una relación enviada por el galeón de Malaca e impresa en 1586 en Sevilla por Fernando Maldonado («venia en medio de su exercito en vn palanquin en ombros de muchos hombres», fol. 27r)39. Algo más de treinta años de diferencia puede estimarse poco significativo, pero sí lo es el hecho de que la primera acotación introduzca un marco geográfico, la India, y la segunda ninguno, pues ambos palanquines serían diferentes.
Eliminando el testimonio de García de Silva y Figueroa, no vuelve a aparecer en CORDE ningún registro del vocablo hasta 1838, algo más de dos siglos después. Se registrará en la décima edición del diccionario académico, publicada en 1852, aunque sin asignar una nueva entrada, sino añadiendo la acepción «especie de andas que se usan en Oriente, para llevar en ellas a los personajes» al lema ya existente derivado de palanca. Implica que, siguiendo las bases rudimentarias de la etimología y la lexicografía histórica, además de a los primeros testimonios de la voz, se debe atender a la precisa cronología y a la geografía.
Desde finales del XVI, el término palanquín se documenta en escritos provenientes de China y Japón que llegaban a España, como en el caso de la relación citada, vía el galeón de Malaca. Estos testimonios subyacen como hipotexto en el tejido de crónicas, compendios y otras publicaciones. De forma que las relaciones de sucesos no solo adelantan las documentaciones, sino que contribuyen a llenar un vacío, como es el caso que nos ocupa, de dos siglos. No se discute hoy que la prensa es el principal vehículo de introducción y difusión de nuevas voces, así pues, no cabe suponer que en otra época fuera de otra manera.
Aunque la lengua áurea se ha visto representada en los manuales y trabajos por la incorporación de italianismos, latinismos y helenismos, es más cuantioso el léxico relegado al olvido. Hallamos más diversidad fuera de la selección perpetuada en los estudios que dentro. Es tiempo de desvincular la historia de la lengua de lengua literaria y contemplar este periodo desde otra óptica. Una voz china puede gozar de la misma antigüedad que una italiana en la lengua española; sin embargo, se ha documentado en otras fuentes, por lo que su estudio ha estado condicionado por el prejuicio del canon y por el favor hacia las obras extensas.
De igual modo, que hasta ahora los historiadores nos hayamos servido de ediciones críticas realizadas por expertos en literatura, no en lengua, también ha supuesto una desventaja. Los usos gráficos pasados han sido considerados, en el mejor de los casos, superfluos; en el peor, directamente un estorbo, es decir, información que no merece la pena ser conservada. Parte de las ediciones con las que contamos han eliminado la «barrera» de los usos lingüísticos pretéritos40; por lo que nos hallamos ante la paradoja de estudiar la historia del español a través de los textos en los que se han suprimido los usos lingüísticos de otras épocas, ya no solo los gráficos, pues también se moderniza cualquier aspecto susceptible de considerarse poco relevante bajo la premisa de acercar los textos a los lectores.
Acercar el texto a los lectores supone, aunque no siempre, alejarlo de los investigadores. Más lógico sería que, ante proyectos de tal envergadura como las ediciones, el trabajo fuera aprovechable por el mayor número de especialistas, no que cada uno deba empezar de cero. Un modelo de trabajo que debe alabarse en este sentido es el iniciado por la red CHARTA, cuyo corpus proporciona un triple acceso a los textos, la reproducción facsimilar, la transcripción paleográfica y la presentación crítica. Seguir este modelo para la edición de los textos de las relaciones de sucesos se convertiría en una situación óptima41. Por supuesto, las relaciones presentan características que nada tienen en común con los documentos archivísticos recogidos en CHARTA; sin embargo, su arquitectura y fundamento metodológico sí merecen ser contemplados42. De igual modo, el hecho de consensuar y seguir unos criterios comunes entre especialistas de diferentes disciplinas solventaría uno de los problemas apuntados acerca del CORDE: las ediciones, quiénes son sus responsables, qué cambios introducen y en qué ejemplar se basan.
Los textos del relacionero Andrés de Almansa y Mendoza han contado, al menos, con tres editores43. De dos de ellos se habían integrado los textos en CORDE, en concreto, las relaciones mencionadas en § 2, volcadas desde la edición de José Simón Díaz publicada en 1982. Pero no es el único editor que figura en el corpus. Con anterioridad, parte de sus escritos, los agrupados en el corpus bajo el título Cartas. Novedades de esta corte y avisos recibidos de otras partes (1626), habían sido publicados por Miguel Ginesta en el año 1886. Algunos de los editados por Henry Ettinghausen y Manuel Borrego en 2001 pueden consultarse en CDH, lo que supone que en los corpus académicos están presentados por tres editores, por tanto, siguiendo tres criterios diferentes.
De ahí que contar con criterios comunes interdisciplinares para la transcripción y edición de un corpus electrónico de relaciones de sucesos se revele una necesidad de primer orden si se pretenden explotar como fuente para el análisis lingüístico44. Contamos con un criterio establecido acerca de los títulos, que se basa en respetar la longitud original, sin abreviar o suprimir palabras, al mismo tiempo que se conservan las grafías y la puntuación. Así pues, el mero hecho de que la grafía y los signos no se alteren ni en los títulos nos indica que no se deben cambiar, porque la modernización de un uso gráfico por otro implica información perdida, en particular, para diferenciar ediciones y estados. Por tanto, afecta a algo más que el aspecto lingüístico, pues confluyen aquí factores bibliográficos e históricos.
En cuanto a la información bibliográfica, si un corpus se compone únicamente de relaciones de sucesos, no es necesaria la distinción, mas, si se integran en un corpus de diferentes tradiciones textuales, sí sería conveniente perfilar una clasificación en exclusiva para este tipo de documentos. Como se ha señalado en § 2, bajo la categoría «Documentos e historia: cartas y relaciones» de CORDE tienen cabida cartas y relaciones, pero acompañadas de cédulas, estatutos, minutas, peticiones, pregones, romances, testamentos y tratados; por consiguiente, la etiqueta se torna de carácter misceláneo.
Conviene indicar también que, a pesar del prejuicio acerca de la longitud de los textos, en líneas generales, los análisis estilométricos demuestran que no se sustenta un crecimiento exponencial, a mayor número de palabras, mayor riqueza léxica. Esta última se basa, sobre todo, en la riqueza de hápax; sin embargo, los autores tienden a repetir las mismas palabras y en el mismo orden. Escenario diferente es el de las relaciones de sucesos, porque, aparte de que su análisis estilométrico podría arrojar luz sobre uno de los conceptos más arraigados acerca de estos impresos, como es su anonimia45, la intervención de varios autores, las modificaciones de los originales y las adaptaciones a los diferentes públicos receptores resultan fácilmente apreciables.
El análisis de las traducciones merece un mayor estudio desde un punto de vista histórico-lexicográfico46, pues registran las corrientes léxicas. De igual modo, las glosas que acompañan las voces extranjeras indica no solo su grado de adaptación, sino información sobre sus destinatarios, porque su empleo depende de la circulación del texto, es decir, de la ubicación del lector47. La ideología es otra vía de análisis, ya que el discurso de las relaciones, en especial, las de fines propagandísticos, puede pervivir en etapas posteriores e influir en las definiciones de los diccionarios, como se observa en las obras lexicográficas publicadas durante los siglos XVIII, XIX y XX con respecto al tratamiento de las voces japonesas48.
Combinando los datos sobre el número de palabras de los textos que proporciona CORDE, se estima que las relaciones de sucesos cuentan de media con dos mil quinientas palabras. La extensión del texto es menor que la de otras obras, pero la información extrapolable contenida puede resultar mayor. En este sentido, para ciertos objetivos se vuelve preferible analizar un corpus reducido de relaciones de sucesos frente a un corpus con miles de documentos. En realidad, si se revisan tanto obras colectivas como individuales de la última década en lingüística diacrónica, se observa que los corpus se están construyendo por cada investigador. Los resultados más prometedores se están logrando empleando corpus pequeños de tradiciones textuales hasta ahora menos atendidas.
Procesar masas de datos textuales está procurando actualmente pocos resultados novedosos en la historia de la lengua española. Los corpus académicos continúan siendo muy empleados, pero se perciben de forma clara en los resultados los condicionantes de la mediatización del canon literario y de la grafía impuesta en las ediciones críticas. En vista de que las condiciones materiales para la investigación en lingüística diacrónica distan de ser las ideales, nos vemos obligados a elegir entre cantidad y calidad. Abogo aquí por menos pero mejor. Más tradiciones textuales y más riqueza lingüística. Pocos textos, pero mejor seleccionados, transcritos y editados.
Por supuesto, la inclusión de las relaciones de sucesos entre los documentos para el estudio histórico de la lengua no va a solventar, por sí sola, la estrechez heredada de las fuentes de información en el ámbito diacrónico. A lo sumo, puede contribuir, primero, a romper con la tradición asentada de una historia de la lengua literaria y, segundo, a ganar un nuevo filón que, por sus características básicas, brevedad y rapidez, supuso una mayor influencia en los usos lingüísticos, sobre todo de los siglos XVI y XVII, de la que se ha podido estimar hasta este momento.
Se han expuesto algunas circunstancias que han marcado el estudio de voces extranjeras, porque la selección de testimonios canónicos ha tenido como consecuencia que aún hoy haya dominios poco atendidos. Por tanto, se ha consolidado una imagen de la lengua áurea que, por obviar la literatura informativa, ha derivado en estática y que implica la ausencia de lenguas en la configuración del español propuesta. De modo que son varias las lagunas lingüísticas y culturales que las relaciones de sucesos pueden ayudar a cubrir, como las primeras documentaciones, la información etimológica, la evolución semántica, el polimorfismo de las transliteraciones y la difusión de unidades a partir de las traducciones. Aunque la innovación léxica es el tema apuntado en este trabajo, también podría recorrerse el camino contrario, esto es, el estudio de voces ya consideradas arcaicas en el momento de impresión y su pervivencia en las relaciones escritas en prosa o verso.
En efecto, del análisis de las relaciones de sucesos surgen nuevos trazados en la historia de la lengua española. Gracias a la catalogación y digitalización de ejemplares, son numerosas las reproducciones facsimilares accesibles, pero, en comparación, son todavía pocas las transcripciones o las ediciones que puedan explotarse lingüísticamente de forma organizada. Con todo, por las aportaciones desde el ámbito de la lengua que han ido apuntando en esta dirección durante los últimos años y la retroalimentación entre las disciplinas que se dedican al estudio de estos impresos, cabe esperar su consolidación como fuente para el estudio diacrónico del español.