En la búsqueda por comprender los orígenes de la inteligencia artificial (IA), es esencial centrarse primero en la esencia de la inteligencia humana. Este concepto, a pesar de su omnipresencia en nuestras vidas, es difícil de definir. Podemos abordarlo desde diferentes ángulos: analizando las capacidades que nos permite, como resolver problemas y aprender habilidades nuevas, o investigando los mecanismos cerebrales subyacentes, el epicentro de nuestra inteligencia.
El cerebro humano, una red compleja de miles de millones de células llamadas neuronas, comunica mediante señales químicas y pequeños impulsos eléctricos, facilitando funciones como el lenguaje, la memoria, la visión y el procesamiento de información. Estas neuronas se activan en respuesta a estímulos externos o mensajes de células nerviosas cercanas. Es este intrincado entramado de redes neuronales el que permite al cerebro aprender eficazmente: fortaleciendo conexiones entre redes de neuronas al aprender algo nuevo y debilitando o eliminando estas conexiones cuando ya no se necesitan.
Los primeros científicos informáticos, inspirados por estos mecanismos biológicos, se propusieron crear máquinas inteligentes mediante la implementación de neuronas artificiales y redes neuronales artificiales (RNA) en la mitad del siglo XX. Estas no eran objetos físicos, sino fragmentos de código que imitaban el comportamiento de procesamiento de información de las células cerebrales reales. Estaban programadas para activarse con entradas específicas y transmitir información a otras neuronas artificiales en su red. A medida que una RNA “aprendía” de un conjunto de datos, la fuerza de las conexiones entre sus neuronas—sus “pesos”—cambiaba en consecuencia, permitiendo que la red interpretara nueva información del mundo real de manera eficaz.
El primer modelo de RNA se basó en unidades llamadas “perceptrones”, capaces de realizar cálculos básicos, como emitir una respuesta de “sí” o “no” ante una nueva entrada. Por ejemplo, si se introducían datos sobre la fuerza y velocidad de atletas en un equipo deportivo, el modelo podría predecir si un nuevo at
leta sería aceptado en el equipo basándose en esas variables.
El camino desde estos primeros y experimentales RNAs hacia los modernos y potentes modelos de lenguaje de gran escala (LLMs) de hoy ha sido largo y está lleno de avances científicos, matemáticos y tecnológicos. La historia abarca varias décadas, con sus respectivos altibajos, pero es una narrativa fascinante de perseverancia e innovación.
Los LLMs de hoy, como GPT (Generative Pre-trained Transformer), son el resultado de esta evolución. Han transformado drásticamente el campo de la IA gracias a su capacidad para generar texto coherente y relevante, interpretar lenguaje humano con una precisión asombrosa y realizar tareas que van desde la redacción de artículos hasta la creación de código de programación.
Esta evolución no habría sido posible sin el desarrollo de ideas clave a lo largo de los años. En las próximas semanas, el podcast “Babbage”, dedicado a la ciencia y tecnología, explorará estas ideas fundamentales para entender cómo la IA generativa de hoy llegó a ser lo que es. Se adentrará más allá del bombo publicitario y la jerga técnica para desvelar los conceptos esenciales en el desarrollo de la IA.
Al final de esta serie, se espera que los oyentes tengan un entendimiento profundo y una gran apreciación por lo que es la IA generativa, sus orígenes y hacia dónde podría dirigirse en el futuro. El primer episodio, ya disponible, se centra en el concepto de inteligencia, estableciendo el marco para una discusión más amplia sobre la IA y sus capacidades.
Este viaje desde las primeras exploraciones de neuronas artificiales hasta los sofisticados LLMs ilustra no solo el avance tecnológico sino también una mejor comprensión de nuestra propia inteligencia. Nos recuerda la importancia de la curiosidad científica y la investigación interdisciplinaria en la búsqueda de replicar la complejidad del pensamiento humano a través de la máquina, abriendo nuevas posibilidades para el futuro de la inteligencia artificial.