IA de la A a la Z
¿Cómo podemos definir la inteligencia artificial? Se trata de una rama de la computación que busca resolver problemas y tomar decisiones imitando las capacidades cognitivas humanas.
La inteligencia artificial (IA) se compone de programas informáticos que han procesado grandes volúmenes de datos. Y, sobre esta base, la tecnología adquiere la facultad de aprender, de razonar, de planificar, incluso de crear. Todo esto permite que los programas o las máquinas puedan adaptar su comportamiento y funcionar de forma autónoma.
Algoritmo
El conjunto de reglas matemáticas que forman instrucciones comprensibles para un ordenador o un servidor, a quienes indica cómo ejecutar una tarea. Todos los sistemas IA se basan en algoritmos.
Alucinación
Así se llama a la respuesta errónea de los modelos IA, por ejemplo, un generador de texto. No son infalibles, a veces responden a la petición del usuario con informaciones falsas o incorrectas. Y lo hacen con total seguridad. De ahí que se hable de alucinar.
‘Big data’
Este término, que no se suele traducir, hace referencia a grandes y complejas bases de datos, así como a las técnicas para su análisis. Son muy útiles, por no decir imprescindibles, para crear y entrenar los modelos IA.
‘Chatbot’
Un programa informático conversacional empleado para la atención al cliente en algunas páginas web. Los chatbots han dado un salto cualitativo con la irrupción de aplicaciones como ChatGPT o Google Gemini.
‘Deepfake’
Un vídeo, aunque también puede ser una imagen o un fragmento de audio, alterado o generado desde cero mediante IA. Normalmente se crean con el propósito de engañar y su potencial para sembrar desinformación es, como poco, preocupante.
Entrenamiento
La forma en que una IA aprende. En una primera fase, al algoritmo se le inyecta un conjunto de datos para entrenarlo. Pero, en algoritmos de aprendizaje automático, la forma en que las personas usan el sistema también le sirve para mejorar sus capacidades.
‘Feedback’ (retroalimentación)
Es la información facilitada al sistema después de que este proporcione una respuesta, con el fin de mejorar su rendimiento. La pueden aportar las personas al indicar si el resultado es positivo (si resuelve la consulta) o negativo (si no la resuelve).
Algunos términos de este glosario brotan como fragmentos de una jerga cocinada a base de IA, por ejemplo prompt, deepfake o alucinación. Otros son tecnicismos computacionales, como red neuronal, que ya permean el vocabulario
GPT
Siglas de Generative Pre-trained Transformer (transformador generativo preentrenado). Es una familia de modelos IA basada en redes neuronales y se puede considerar el motor de la aplicación ChatGPT. GPT-4o es su última versión.
‘Human-in-the-loop’
(humano en el circuito o supervisado por un ser humano)
Esta expresión, de difícil traducción, destaca la importancia de contar con personas en el proceso de la IA. La idea es que siempre exista la supervisión de un humano para evaluar los resultados.
IA generativa
Una nueva clase de IA, distinta a la que servía para análisis de datos y lleva décadas operativa. Como indica su nombre, va mucho más allá y es capaz de crear contenido en forma de texto, imágenes, vídeo o música.
IA discriminativa
También llamada IA tradicional o analítica, convive con nosotros desde hace tiempo. Se utiliza en tareas de clasificación de elementos, ya sean imágenes, texto u otro tipo de datos. Sin embargo, no es capaz de generar contenido por sí misma.
LLM (Large Language Model o modelo de lenguaje extenso)
Algoritmos complejos de IA entrenados a partir de un enorme conjunto de datos con el objetivo de entender textos y generarlos. Se basan en la tecnología de procesamiento del lenguaje natural. ¿Un ejemplo de LLM? GPT-4.
NLP (Natural Language Processing o procesamiento de lenguaje natural)
En él se basan los modelos de lenguaje (LLM). Su objetivo es entender la forma de hablar y comunicarse de las personas para extraer información de textos o incluso generarlos. También se usan las siglas en castellano: PLN.
OpenAI
Probablemente la compañía más importante hasta el momento en el campo de la IA generativa. Es la desarrolladora de ChatGPT y de otras aplicaciones como el generador de imágenes Dall-E o el asistente de programación OpenAI Codex.
‘Open source’ (código abierto)
Software publicado bajo una licencia que permite a terceros utilizar libremente esa programación. En IA existen modelos propietarios, como los GPT de OpenAI, y otros open source, por ejemplo, Llama 2, de Meta.
‘Prompt’
Petición en forma de texto, escrito en lenguaje natural, que se proporciona al modelo IA para que genere una respuesta. Dicho de otra forma, las instrucciones que le damos a una IA generativa para que desarrolle una tarea concreta.
Redes neuronales
Modelos computacionales inspirados en el funcionamiento del cerebro humano. Estos nodos interconectados añaden complejidad y precisión a las respuestas de un algoritmo que utiliza aprendizaje automático o profundo.
Sesgo
Tendencia de un modelo IA que le impulsa a entregar sistemáticamente resultados equívocos, debido a un entrenamiento deficiente. Así, puede reproducir las inclinaciones machistas o racistas, por ejemplo, presentes en los datos con los que se entrena.
Transformador
Un tipo de red neuronal que usa técnicas de aprendizaje profundo para comprender la importancia de la consulta planteada. Y lo hace por partes: por ejemplo, al introducir una instrucción, el transformador se centra en las palabras relevantes de la frase para comprenderla en su conjunto. GPT es un ejemplo.
Visión artificial
Es una vertiente de la IA que procesa y analiza información visual con el fin de reconocer todo tipo de objetos y contextos en imágenes y vídeos. Se emplea en robótica, coches autónomos o automatización industrial.
ZeroGPT
ZeroGPT, GPTZero y otras variantes son herramientas de detección de textos generados. No solo identifican el contenido de ChatGPT, también el de Google Gemini y otros modelos. Al parecer, las IA se reconocen entre sí.
Lo que ocurre cuando le das una orden a un chatbot
Intervienen muchos más elementos de los aparentes para que ChatGPT o Google Gemini nos devuelvan una repuesta. Al introducir la consulta y pulsar Enviar, nuestro texto, codificado por el programa, corre por las redes de los operadores hasta llegar a un centro de datos. Allí, los servidores, propiedad del desarrollador de la IA o de otra empresa, reciben la petición y la procesan con una enorme capacidad de cómputo. La operación no solo servirá para entregar un resultado, además los datos de nuestro texto se emplearán para entrenar y mejorar el sistema que estamos utilizando.
Mientras tanto, nos ha llegado la respuesta tras surcar las redes de operadores directa a nuestra pantalla. El texto que nos devuelve el chat es el resultado de aplicar un enorme modelo estadístico. La IA predice las secuencias de palabras que mejor responden a nuestra petición, según el bagaje que acumula, es decir, el conjunto de datos con el que se ha entrenado. Esto significa que la respuesta se basa en pura probabilidad. De ahí que los chatbots nos entreguen cada vez un texto diferente a la misma pregunta, aunque en esencia diga lo mismo. Es su forma de imitar la creatividad humana.