Nuevos términos para una nueva era
El director de innovación social en el Instituto de Ingeniería del Conocimiento reflexiona sobre el papel que pueden jugar las redes sociales en la aceptación de neologismos
La lengua lleva desde sus orígenes en un proceso de evolución constante y es que por definición es un sistema complejo cambiante. Nuevas palabras y formas de comunicación aparecen cada día como fruto de ese desarrollo incesante que sufren todas las lenguas vivas en el mundo.
Esta evolución siempre ha dado lugar a cambios significativos en el lenguaje como el nacimiento de las lenguas romance a partir del latín. Por ello, la sociedad no debe obviar estas transformaciones, que hacen mantener vivas las lenguas y potencian su desarrollo.
Detectar neologismos es una tarea compleja puesto que, para que una palabra sea considerada como tal, tiene que pasar una serie de filtros. Entre ellos, tener un uso extendido entre los hablantes de dicha lengua. Este estadio quizás sea el más complicado de detectar puesto que es una misión ardua poder constatar que un término está ya generalizado. Ahí es donde entra la tecnología big data, en la captación de nuevas palabras que estén en uso por parte de los hablantes y sean susceptibles de considerarse neologismos.
Actualmente, Twitter es un medio muy adecuado para llevar a cabo esta misión, para conocer cómo habla y de qué manera utiliza el lenguaje la sociedad. La red de microblogging es el canal más indicado para detectar la innovación lingüística por el contexto espontáneo e inmediato en el que se desenvuelve. Aquí, los usuarios se expresan tal y como hablan, lo que sin duda supone el mejor punto de partida para poder detectar los nuevos términos que la sociedad ya tiene asimilados, pero que los diccionarios todavía no reflejan en sus páginas. Ocurre lo mismo con los préstamos léxicos, las palabras que el conjunto de los hablantes de una lengua acaban asimilando y utilizando como propias.
Con ayuda del big data y la lingüística computacional, hacer esta búsqueda de nuevas palabras y préstamos léxicos resulta una tarea asimilable para los estudiosos. Gracias a sus herramientas, es posible rastrear y hacer una búsqueda amplia en la red social para detectar aquellas que puedan ser las indicadas a pasar a formar parte del grupo de palabras de un idioma.
El big data y la lingüística computacional, convierten la búsqueda de neologismos en una tarea asequible para los estudiosos
Con las herramientas de procesamiento de lenguaje natural, los lingüistas computacionales realizan las labores de búsqueda en Twitter y pueden encontrar las palabras se están utilizando actualmente y no están recogidas en los diccionarios de uso actuales. Para llevar a cabo esta tarea, se distinguen tres fases claras: una primera de compilación de todo el contenido de los mensajes emitidos por el mismo grupo de hablantes. Aquí, se realiza un filtro para obtener el corpus necesario para analizar los términos. Seguidamente se produce una limpieza exhaustiva de los mensajes eliminando todo ruido para la investigación: URLs, emoticonos, menciones de usuarios, signos de puntuación… Una vez realizada esta limpieza se analiza todo el material obtenido y se extraen los términos para analizar, eliminando casos que no sean de interés. En este estadio se aplican una serie de filtros automáticos para detectar palabras desconocidas, descartar nombres propios, onomatopeyas, risas, diminutivos o palabras con sufijos.
La sociedad va evolucionando constantemente y desde la llegada de la era digital estas transformaciones son cada vez más aceleradas. La posibilidad de poder comunicarse con cualquier rincón del mundo y la aparición de nuevos procesos, herramientas o situaciones hacen que el lenguaje se vea también obligado a evolucionar y a crear nuevos términos que describan esas nuevas realidades o a tomar prestados de otras lenguas con las que entramos en contacto diariamente. Estos neologismos y préstamos no son sino una prueba más de todos los cambios que la sociedad experimenta casi a diario. Recogerlos y darles su lugar en el lenguaje es una tarea difícil para los lingüistas pero tienen en el big dataal mejor socio para poner nombre y dotar de significado a las nuevas realidades.
Pablo Haya es director de innovación en el área social business analytics en el Instituto de Ingeniería del Conocimiento.
Tu suscripción se está usando en otro dispositivo
¿Quieres añadir otro usuario a tu suscripción?
Si continúas leyendo en este dispositivo, no se podrá leer en el otro.
FlechaTu suscripción se está usando en otro dispositivo y solo puedes acceder a EL PAÍS desde un dispositivo a la vez.
Si quieres compartir tu cuenta, cambia tu suscripción a la modalidad Premium, así podrás añadir otro usuario. Cada uno accederá con su propia cuenta de email, lo que os permitirá personalizar vuestra experiencia en EL PAÍS.
En el caso de no saber quién está usando tu cuenta, te recomendamos cambiar tu contraseña aquí.
Si decides continuar compartiendo tu cuenta, este mensaje se mostrará en tu dispositivo y en el de la otra persona que está usando tu cuenta de forma indefinida, afectando a tu experiencia de lectura. Puedes consultar aquí los términos y condiciones de la suscripción digital.