El test inventado por Alan Turing para diferenciar humanos de máquinas tuvo varias re-ediciones en el siglo pasado. Una de las más curiosas fue un experimento de Joseph Weizenbaum en el que una máquina imitaba a un psicoterapeuta. El resultado: los usuarios se sintieron tan comprendidos que, al final, “eligieron no creer” que se trataba de un experimento. ¿Pueden las máquinas programarse para sentir empatía?
Este relato se incluye en el libro “Speech and Language Processing”, de Daniel Jurafsky y James H. Martin. La traducción es propia.
Para muchos, la habilidad de las computadoras de procesar lenguaje tan eficientemente como los humanos significaría la llegada de las máquinas verdaderamente inteligentes. La base de esta creencia es el hecho de que el uso del lenguaje está relacionado fuertemente con nuestras habilidades cognitivas generales. Entre los primeros en considerar las implicaciones de esta fuerte interrelación para la informática estuvo Alan Turing (1950). En un famoso paper, Turing introdujo lo que después se daría a conocer como el Test de Turing. El partía de la tesis de que la cuestión de si las máquinas eran capaces de pensar o no era, esencialmente, indefinible, debido a la imprecisión inherente a los términos máquina y pensar. En vez de eso, él sugirió un test empírico, un juego, en el cual el uso del lenguaje por parte de la computadora sería la base para determinar si ella podía o no pensar. Si la máquina ganaba el juego, podría ser juzgada como “inteligente”.
En el juego de Turing, hay tres participantes: dos personas y una computadora. Una de las personas responde y la otra interroga. Para ganar el juego, el interrogante debe determinar cuál de los otros dos participantes es la máquina, a partir de una serie de preguntas emitidas a través de un teletipo. El rol de la máquina es engañar al interrogador, hacerle creer que es una persona, respondiendo a sus preguntas como lo haría una persona. La tarea del segundo humano es convencer al interrogador de que el otro participante es una máquina, y que él o ella es el ser humano.
La siguiente interacción, extraída del paper de Turing, ilustra el tipo de interacciones que él tenía en mente. Claramente, una simulación convincente de “humanidad” no requiere ser un experto en todos los dominios:
P: Por favor, escribime un soneto sobre el Puente de Forth.
R: No cuentes conmigo. Yo nunca podría escribir poesía.
P: Sumá 34957 más 70764.
R (pausa de unos 30 segundos): 105621.
Turing predijo que alrededor del fin del siglo XX una máquina con 10 gigabytes de memoria podría tener un 30% de chance de engañar a un interrogador humano después de 5 minutos de preguntas. Dado el hecho de que podés engañar a alguna gente todo el tiempo, no está claro cuán riguroso es este cálculo en particular. No obstante, el punto clave para Turing es que usar el lenguaje tal como lo haría un ser humano es suficiente, en sí mismo, como un test operacional de inteligencia.
Sorpresivamente, muchas de las cuestiones postuladas por Turing se volvieron relevantes ya en 1966, en el contexto del programa ELIZA (Weizenbaum, 1966). ELIZA era un primitivo programa de procesamiento de lenguaje natural, capaz de llevar adelante una forma limitada de conversación con un usuario. Consideremos la siguiente sesión con una versión de ELIZA que imitaba las respuestas de un psicoterapeuta rogeriano.
Usuario 1: Sos como mi padre, en algunos aspectos.
ELIZA: QUÉ PARECIDO ENCONTRÁS CON TU PADREUsuario 2: No sos muy agresivo, pero creo que no querés que yo me dé cuenta de eso.
ELIZA: QUÉ TE HACE PENSAR QUE NO SOY AGRESIVOUsuario 3: No estás discutiendo conmigo.
ELIZA: QUÉ TE HACE PENSAR QUE NO ESTOY DISCUTIENDOUsuario 4: Me tenés miedo.
ELIZA: TE HACE SENTIR BIEN PENSAR QUE TE TENGO MIEDO
ELIZA era un programa bastante simple basado en un sistema de comparación de patrones para procesar el input y transformarlo en un output adecuado. El éxito de esta simple técnica en este dominio fue debido al hecho de que ELIZA no necesita saber realmente nada para imitar a un psicoterapeuta rogeriano. Como Weizenbaum hace notar, este es uno de los pocos géneros de conversación donde el que escucha puede actuar como si no supiera absolutamente nada del mundo.
La profunda relevancia de ELIZA, respecto a las ideas de Turing, es que de hecho mucha gente que interactuó con ELIZA terminó creyendo que la máquina realmente entendía sus problemas. De hecho, Weizenbaum (1976) nota que mucha de la gente continuaba creyendo en las habilidades de ELIZA incluso después de que se les explicara cómo funcionaba el programa. Más recientemente, los reportes informales de Weizenbaum fueron repetidos en un contexto algo más controlado. Desde 1991, un evento conocido como el Premio Loebner intentó someter a varias computadoras al Test de Turing. A pesar de que esos premios tienen poco interés científico, un resultado consistente a través de los años muestra que incluso el más rudimentario de los programas puede engañar a algunos jueces por algún tiempo (Shieber, 1994). No sorprende que estos resultados no hayan sino contribuido a reforzar el consenso sobre la adecuación del Test de Turing como un test para determinar la inteligencia o no de una máquina, tanto entre filósofos como entre investigadores de Inteligencia Artificial (Searle, 1980).