Judea Pearl, experto en inteligencia artificial: “Es la primera vez que podemos entender lo que es entender”
Gran parte de los hitos recientes de la inteligencia artificial se basan en redes neuronales, algoritmos de aprendizaje profundo capaces de entrenarse a sí mismos en una tarea determinada a partir de la información que se les proporciona. Así, las máquinas han sido capaces de vencer a los mejores jugadores de ajedrez, poker o go, o de resolver problemas que están más allá de la capacidad humana, como el del ‘plegamiento de las proteínas’.
Pero el camino que conduce a estos éxitos es como una caja negra, ni siquiera sus creadores pueden discernir cómo la máquina ha llegado a resolver el problema. Científicos como Judea Pearl trabajan para que otro camino sea posible, para que la interpretabilidad sea una de las bases de la IA. Sus esfuerzos para lograr que ésta sea “menos opaca” le han valido el Premio Fundación BBVA Fronteras del Conocimiento, en la categoría de Tecnologías de la Información y la Comunicación.
Sus contribuciones conceptuales, formales y matemáticas permiten integrar en los programas de IA dos grandes vías que utilizamos los humanos para entender el mundo y tomar decisiones: la probabilidad y la causalidad. “El trabajo de Pearl es fundamental porque aporta herramientas que permiten dotar a las máquinas de conocimientos basados en las relaciones causa-efecto que utilizamos las personas en la vida cotidiana”, explica Ramón López de Mántaras, director del Instituto de Investigación de Inteligencia Artificial (IIIA) del CSIC y uno de los impulsores de la candidatura de Pearl. “Ha contribuido a crear un lenguaje matemático para que un sistema de IA pueda explicar no solamente el porqué de sus decisiones sino también responder a preguntas de tipo What if?, es decir, ¿qué hubiera pasado si las cosas se hubieran hecho de otra manera? Por ejemplo, en medicina, ¿qué hubiera pasado si hubiéramos dado otra medicación a un paciente?”.
Judea Pearl nació en Tel Aviv (Israel) cuando la ciudad todavía formaba parte del mandato británico de Palestina, en 1936. A finales de los 60 se incorporó a la Universidad de California en Los Ángeles, donde hoy es Chancellor’s Professor (el grado académico más alto que otorga el centro) en el Departamento de Sistemas de Ingeniería y en el de Ciencias de la Computación, además de ser director del Laboratorio de Sistemas Cognitivos. Es autor de siete libros, más de 300 artículos científicos y varias decenas de informes técnicos. Sus escritos “han inspirado avances trascendentales en la comprensión del razonamiento y el pensamiento”, según resume el acta del jurado.
Transparencia
Gracias al lenguaje formal desarrollado por Pearl, los procesos esenciales en la toma de decisiones pueden ser integrados en los programas informáticos. Sus trabajos han conseguido una mayor transparencia para la IA y, al permitir la trazabilidad del razonamiento, son también un aliado especialmente valioso en campos como la medicina, el derecho o la economía, además de proporcionar un mayor control sobre estos procesos.
“Es la primera vez que podemos entender lo que significa entender, la primera vez que tenemos un modelo computacional de la comprensión profunda”, ha resumido el propio Pearl, en declaraciones tras conocer el fallo. Eso significa “ser capaz de responder preguntas en tres niveles importantes: la predicción, el efecto de las acciones y su explicación; es decir, por qué las cosas ocurrieron como lo hicieron y qué habría pasado si hubieran ocurrido de otra manera. Estos tres niveles de sofisticación son los que el lenguaje computacional capta ahora y eso es lo que entendemos por comprensión”.
El razonamiento probabilístico y la capacidad de establecer relaciones de causalidad son las dos áreas en que las aportaciones de Pearl son más relevantes. “La incertidumbre es la materia prima que prevalece en la toma de decisiones cotidianas, incluso al cruzar la calle, tomar una aspirina o hablar con amigos”, explica, “nos cuesta bastante hacer que un ordenador pueda lidiar con el aluvión de ruido e información incierta que tiene sobre el mundo. Mi trabajo ha desarrollado un cálculo para el razonamiento probabilístico que permite al ordenador manejar toda la información que le llega, integrarla y asignar probabilidades a cada posible conclusión”.
Redes bayesianas
En la década de los ochenta Judea Pearl desarrolló el lenguaje matemático necesario para integrar la IA clásica y la teoría de la probabilidad. Su libro ‘Probabilistic Reasoning in Intelligent Systems’, publicado en 1988 sigue siendo la referencia en esta área. Sirvió de presentación para sus modelos gráficos, las llamadas redes bayesianas, convertidas desde entonces en un elemento básico del aprendizaje automático y la estadística moderna.
Una red bayesiana es una representación de sucesos y la probabilidad de que ocurran; permite articular visualmente redes de sucesos complejas y sus relaciones probabilísticas, lo que a su vez permite a los ordenadores resolver situaciones hipotéticas del mundo real, descubrir dependencias latentes y predecir resultados mediante la propagación de probabilidades.
La importancia de saber inferir relaciones de causalidad es clave para desentrañar los procesos. “Las relaciones causales han sido un obstáculo muy difícil de manejar tanto para las personas como para las máquinas; no tenemos el lenguaje formal para captar la idea de que el canto del gallo no causa la salida del sol, aunque se produzca siempre antes y permita predecirla”, explica el científico.
En su libro Causality, publicado en 2002, Pearl explora esta cuestión y proporciona un marco formal para inferir relaciones a partir de datos. Y lograr que las máquinas detecten relaciones de causalidad abre la puerta a múltiples aplicaciones. “Ahora tenemos un lenguaje que permite emplear nuestros conocimientos sobre el mundo para inferir algo de forma coherente”, asegura, “como hacemos en el álgebra: inferimos una conclusión y se demuestra que esta conclusión es correcta, si las suposiciones lo son. Las aplicaciones van desde la medicina personalizada hasta el manejo de una pandemia como la del Covid, integrando información de numerosos países y llegando a conclusiones coherentes a partir de la evidencia disponible”.