Las lenguas indoeuropeas se expandieron por Eurasia en oleadas y desde orígenes diferentes
Un análisis etimológico de las palabras y el ADN antiguo reescriben el viaje que iniciaron hace 8.000 años los idiomas que hoy habla la mitad de la población mundial
Noche viene del término latino noctis, que en griego se dice nyktós, en inglés moderno night, nuit en francés y en sánscrito, la lengua clásica de India, naktasya. Uno de los primeros en detectar que todos estos idiomas podrían tener un origen común fue el jesuita francés Gaston-Laurent Coeurdoux hace 250 años. Desde entonces, los lingüistas han buscado el origen de todas estas lenguas, las indoeuropeas, como si fueran Indiana Jones. Ahora, en un esfuerzo ...
Noche viene del término latino noctis, que en griego se dice nyktós, en inglés moderno night, nuit en francés y en sánscrito, la lengua clásica de India, naktasya. Uno de los primeros en detectar que todos estos idiomas podrían tener un origen común fue el jesuita francés Gaston-Laurent Coeurdoux hace 250 años. Desde entonces, los lingüistas han buscado el origen de todas estas lenguas, las indoeuropeas, como si fueran Indiana Jones. Ahora, en un esfuerzo de decenas de científicos que han combinado análisis lingüístico, computación avanzada, arqueología y ADN antiguo, le han puesto fecha al llamado protoindoeuropeo y reubicado en el mapa desde dónde partieron los humanos que lo hablaban.
En la actualidad se hablan unas 400 lenguas indoeuropeas, según la base de datos de Glottolog (aunque la frontera entre variedad regional, dialecto y lengua hace algo arbitraria esta cifra). Casi la mitad de los humanos hablan alguna de ellas. Su expansión original llevó a sus primeros hablantes, en un proceso que duró milenios, a poblar áreas desde hasta la actual Irlanda, en el oeste, hasta la parte occidental de China, en el este, y desde tierras escandinavas, en el norte, hasta la India, en el sur. Los expertos en este campo se han dividido durante décadas en dos grandes bloques: por un lado, los que defienden que el llamado protoindoeuropeo antecesor, se hablaba en el norte del Creciente Fértil, en las fronteras actuales de Turquía, Líbano e Irak hace unos 9.000 años. Esta es una de las zonas donde apareció la agricultura y, con su expansión, aquellos agricultores propagaron su lengua. Pero hay una hipótesis alternativa: entre hace 6.000 y 4.500 años se produjeron una serie de movimientos por parte de poblaciones de las estepas tanto hacia el oeste como hacia el este. Pueblos como los misteriosos yamnaya, por ejemplo, llevaron sus lenguas hacia Europa, unas lenguas que fueron el germen de las ramas itálica, germánica y celta del árbol indoeuropeo.
Al frente de más de 80 científicos, la mayoría lingüistas y genetistas, el investigador Paul Heggarty mantiene ahora que tanto la hipótesis de los agricultores anatolios como la de los pastores esteparios están equivocadas... y tienen parte de razón. “Analizamos los datos lingüísticos como si fuera datos genéticos”, dice. Para ello, han creado una base de datos con 5.013 cognados, palabras que etimológicamente comparten un origen común, como las distintas formas decir noche. Los términos procedían de 161 lenguas indoeuropeas, 52 de ellas antiguas o ya muertas, como el tocario, el gótico o el castellano antiguo. Con todo ello crearon el árbol filogenético de las lenguas indoeuropeas. Para saber cuándo se separó cada rama (hoy hay diez ramas vivas), le pusieron fecha a los idiomas de los que no se conocía su datación. “Por ejemplo, para el latín clásico, fijamos el 50 antes de nuestra era”, explica Heggarty, que lidero el proyecto mientras era profesor del Instituto Max Planck de Antropología Evolutiva (Alemania). Y fueron yendo para atrás buscando el punto de origen. “El método intenta reunir todas las ramas para ver la edad del ancestro común a todos los idiomas”, añade el ahora profesor de la Pontificia Universidad Católica del Perú.
Este linaje lingüístico indoeuropeo ya se había diferenciado en múltiples ramas independientes hace aproximadamente 7.000 años, según detallan los autores de esta investigación en la revista científica Science. “Esto descartaría la hipótesis de la estepa”, recuerda Heggarty. La fecha más probable en el que el protoindoeuropeo tuvo su primer evento de diversificación habría sido hace 8.120 (con un margen de variación de varios siglos por arriba y por abajo). En apoyo de la alternativa anatolia, recientes estudios de ADN antiguo apuntan que agricultores de la región caucásica entre el mar Negro y Caspio se expandieron hacia Anatolia. El hitita, idioma hablado por habitantes de la civilización anatolia del mismo nombre, constituye otra rama mayor, hoy extinta, de la familia indoeuropea.
En apoyo de la alternativa anatolia, recientes estudios de ADN antiguo apuntan que agricultores de la región caucásica —entre el mar Negro y el Caspio— se expandieron hacia Anatolia y quizá más al oeste, hasta la península griega y lo que hoy es Albania. Durante décadas, hubo un gran grupo de lingüistas que defendían que el hitita, idioma hablado por habitantes de la civilización anatolia del mismo nombre, era el ancestro común de los otros idiomas indoeuropeos, con algunos considerando que sería incluso el heredero directo del protoindoeuropeo, el primer idioma de la familia.
Pero el ADN antiguo también estaba dando pruebas a los que defendían la hipótesis esteparia. Desde 2015, se ha ido descubriendo que pueblos venidos desde la estepa póntica, al sur y noreste de las actuales Rusia, Ucrania y Kazajistán, fueron colonizando Europa central hace entre 6.000 y 4.500 años, dejando su huella tanto en la genética de los modernos europeos como en las poblaciones autóctonas de entonces. Hay trabajos en 2018 y 2019, por ejemplo, que muestran como hombres venidos del este pudieron reemplazar a casi todos los varones que entonces vivían en la península ibérica. Fueron estos pueblos los que trajeron las lenguas itálicas, germánicas o célticas. Cuando salieron de su lugar de origen, deberían de hablar todos el mismo idioma o muy parecidos, algún sucesor del protoindoeuropeo. Es en el largo periplo (los celtas tardaron siglos en alcanzar lo que hoy es Irlanda) y sobre todo una vez asentados y en contacto con las poblaciones locales cuando se inicia la diversificación entre unas lenguas que en su inicio deberían ser la misma.
“Ni el albanés, ni la cultura micénica, que hablaban griego, ni la hitita tienen señal genética dominante de la estepa”Paul Heggarty, investigador del Instituto Max Planck de Antropología Evolutiva, Alemania
Explicar esto es la gran aportación del trabajo de Heggarty. Combinado el análisis filogenético de los cognados con lo que ha aportado el ADN antiguo, resulta que pudo haber dos orígenes sucesivos. En un primer momento, la expansión se produjo desde la región sur del Cáucaso, con cinco de las grandes familias lingüísticas ya separadas hace 7.000 años. “Ni el albanés, ni la cultura micénica, que hablaban griego, ni la hitita, tienen señal genética dominante de la estepa”, recuerda Heggarty. Pero varios milenios después hubo otra oleada, esta protagonizada por los pastores esteparios del norte, de la que nacerían las ramas occidentales del árbol y probablemente también las lenguas eslavas y bálticas y quizá las extinguidas del tocario, en lo que hoy es el Tíbet, y las que llegaron hasta el subcontinente indio.
El latín y el origen de las lenguas romances
La diversificación no se detuvo ahí. Cuando el latín era solo el idioma de Latium, una de las regiones del centro de lo que hoy es Italia, solo en la península itálica había más de 400 idiomas, la mayoría itálicos, es decir, pertenecientes a una rama indoeuropea. “Con los soldados de las legiones, el latín llegó a todo el continente”, recuerda el profesor de la Universidad Jaume I y experto en la diversificación de las lenguas romances, Kim Schulte. Se produce entonces un doble proceso, mientras la expansión del idioma imperial (como sucedería con la del español y el inglés en América siglos después), acaba con la mayoría de las lenguas locales, lleva ya en su interior la semilla de la división.
“La creencia del origen medieval de las lenguas romances procede de que es entonces cuando aparecen los primeros escritos en castellano, catalán o francés, pero se hablaban ya siglos antes”. Según los autores del estudio, la diversificación del latín vulgar en las distintas lenguas romances ya empezó en las primeras décadas de esta era. Las razones para que, incluso en una unidad política como la Roma imperial, la lengua se rompa en nuevos pedazos son varias. Algunas las apunta Schulte: “Una es el contagio de los idiomas locales, como el antiguo íbero o tartésico en España. Otra es el control político: El rumano es de los primeros en diferenciarse porque los romanos controlaron la Dacia [región histórica de la actual Rumanía] solo unos 200 años. La distancia geográfica también es muy importante”. Y pone el ejemplo de la palabra mensa, que en el latín clásico significa mesa, en español, o masa, en rumano. Sin embargo, otras regiones más cercanas a Roma adaptaron una innovación lingüística del latín vulgar, como era la palabra tabula. Así, en italiano, mesa se dice tabula, en catalán taula y en francés table. En conjunto, termina Schulte, “en España y otras partes había dialectos desde principios del imperio”.
Puedes seguir a MATERIA en Facebook, Twitter e Instagram, o apuntarte aquí para recibir nuestra newsletter semanal.