En este artículo te hablamos sobre uno de los experimentos más conocidos en el campo de la inteligencia artificial: el Test de Turing. ¿En qué consiste esta prueba? ¿Qué mide? ¿Qué variantes existen? ¿Sigue siendo aceptada como una prueba válida hoy en día?
¿Qué es el Test de Turing?
El Test de Turing es una prueba prueba diseñada por Alan Turing que evalúa la capacidad de una máquina para comportarse de forma similar a un humano.
En la prueba de Turing, el investigador se enfrenta a una conversación con humanos y una máquina, sin saber quién es cada cual. La conversación se desarrolla únicamente a través de textos que el entrevistador recibe en una computadora.
El objetivo de la prueba es comprobar si el entrevistador es capaz de distinguir entre sus interlocutores humanos o la inteligencia artificial, o si la máquina es capaz de ofrecer respuestas como las de un humano, hasta el punto de engañar al entrevistador.
Turing propuso en su momento que el test se consideraría superado si la máquina lograba engañar al entrevistador el 70% del tiempo durante 5 minutos de conversación.
Pero profundicemos un poco más en el Test de Turing, sus variantes, y algunas de las corrientes de pensamiento favorables o contrarias a esta prueba.
El Test de Turing evalúa la capacidad de una máquina para comportarse de forma similar a un humano.
¿Qué evalúa realmente la prueba de Turing?
El Test de Turing no mide los conocimientos de la máquina, o su capacidad para ofrecer respuestas verdaderas. Lo único que evalúa esta prueba es la capacidad de una inteligencia artificial para ofrecer respuestas de manera similar a que lo haría un sr humano, a través del lenguaje natural.
Por ejemplo, imaginemos que en esta prueba una máquina se hace pasar por un deportista de élite. En este caso, no importa cuántos datos tenga almacenados la máquina sobre dicho deporte, sino su capacidad para hacer creer al entrevistador de que realmente está conversando con un deportista de élite.
Por ello, en la prueba se utilizan preguntas que van desde información básica hasta otra más compleja y que solo debería ser entendida por humanos, como por ejemplo, “¿qué sensación tuvo la primera vez que ganó?“.
¿Quién era Alan Turing?
El Test de Turing recibe su nombre de Alan Turing (1912-1954). Turing fue un verdadero hombre renacentista en pleno siglo XX y es conocido, entre otras cosas, por sus actividades como matemático, informático, criptógrafo, biólogo e incluso como corredor de maratones.
Turing es considerado uno de los padres de la computación y de la informática moderna. Una de sus creaciones más destacadas fue la máquina de Turing, un dispositivo que era capaz de manipular símbolos de acuerdo a una tabla de instrucciones, y que era capaz de simular la lógica de cualquier algoritmo de un ordenador.
Otro de los grandes logros de Turing fue conseguir descifrar los códigos nazis de la máquina Enigma durante la 2ª Guerra Mundial. Se dice que gracias a su labor cortando las comunicaciones del ejército nazi, se pudo acortar la duración de la guerra entre dos y cuatro años.
Tras la guerra, dedicó la mayor parte de sus esfuerzos a las ciencias de la computación. De hecho fue él quien construyó uno de los primeros ordenadores programables en el Laboratorio Nacional de Física del Reino Unido y en la Universidad de Mánchester.
En definitiva, Alan Turing fue uno de los primeros en desarrollar los conceptos de “computación” y “algoritmo” a través de su máquina de Turing, y también es uno de los padres fundadores de la inteligencia artificial, con su diseño del Test de Turing.
Turing fue un verdadero hombre renacentista en pleno siglo XX y es conocido, entre otras cosas, por sus actividades como matemático, informático, criptógrafo, biólogo e incluso como corredor de maratones.
¿Cómo se le ocurre a Turing la idea de este Test?
El experimento de Turing está inspirado por un concurso de televisión llamado “El juego de imitación” en el que un hombre y una mujer debían responder a las preguntas del público. Ambos se encontraban en salas cerradas y separadas, y debían escribir sus respuestas a máquina, para evitar revelar su voz o su imagen física. El objetivo del público era, a través de las respuestas, descubrir quién era el hombre y quién la mujer.
Turing se preguntó qué ocurriría si se sustituiría a uno de los dos participantes (no importa si es el hombre o la mujer) por una máquina. Propuso el experimento por primera vez en su ensayo “Computing Machinery and Intelligence“. en 1950. En dicho escrito, Turing propone la cuestión de si las máquinas pueden pensar. Al ser una pregunta demasiado difícil y compleja de contestar ya que la palabra “pensar” puede ser demasiado ambigua, él mismo propone otra pregunta más concreta: “¿Existen computadoras digitales que puedan tener un buen desempeño en el juego de imitación?“.
Versiones del Test de Alan Turing
El Test de Alan Turing ha tenido diferentes versiones que han ido ahondando en la inteligencia artificial de las máquinas y su capacidad para imitar el comportamiento humano. Veamos cuáles son algunas de estas pruebas.
Prueba de imitación
El experimento original de Turing propone un escenario en que el individuo A es un hombre, el individuo B es una mujer, y el individuo C es el entrevistador. El individuo C no tiene contacto visual con ninguno de los otros dos, y les pasa las preguntas a través de notas escritas. El objetivo del individuo A es engañar al interrogador para que se equivoque en su elección, mientras que el del individuo B es auxiliarle para que acierte en su decisión.
En la prueba de Turing, el rol del individuo A se sustituye por una máquina que pretende hacerse pasar por mujer y llevar al entrevistador a una respuesta errónea. Para determinar el éxito del experimento, se comparan los resultados cuando el individuo A es un hombre respecto a cuando es una máquina.
Prueba de interpretación estándar
Esa versión del Test de Turing es similar a la anterior, con la excepción de que en este caso el individuo A es una máquina, mientras que el individuo B es un humano, sin importar si se trata de un hombre o una mujer.
Prueba Captcha
La prueba de Captcha es un test de Turing en reversa. Todos hemos tenido que enfrentarnos alguna vez a una de estas pruebas en internet. Solicita al individuo reconocer e insertar en un campo de texto una serie de caracteres alfanuméricos que aparecen en una imagen distorsionada. Se supone que una máquina no sería capaz de leer y reproducir la imagen, por lo que si alguien ha logrado pasar la prueba se sobreentiende que es humano. Este método se utiliza habitualmente para evitar la entrada de software automatizado potencialmente perjudicial para un sitio web.
Prueba de la seña de inteligencia mínima
Esta versión del test de Turing fue diseñada por Chris McKinstry y tiene como objetivo reducir al abstracto máximo os resultados de la prueba. Para ello, solo se permiten respuestas binarias, del tipo SI/NO o VERDADERO/FALSO. En este caso, se trata de un experimento que se centra más en la capacidad de pensar de las máquinas.
Inteligencias artificiales que superaron el Test de Turing (o no)
A lo largo del tiempo ha habido diversas inteligencias artificiales que se han enfrentado a la prueba de Turing. Pero, ¿cuáles la han logrado superar con éxito, si es que ha habido alguna?
ELIZA
La inteligencia artificial ELIZA fue creada en 1966 por Joseph Weizenbaum, quien aseguraba que sería capaz de pasar el test de Turing,
Esta software funcionaba en base a la detección de palabras clave. Ante una pregunta, ELIZA detectaba una serie de palabras clave y desarrollaba una respuesta en torno a ellas. En caso de no encontrar ninguna palabra clave, daba una respuesta genérica o repetía algún comentario anterior.
Según parece, aunque las fuente no resultan del todo fiables, ELIZA fue capaz de engañar a muchos entrevistadores, e incluso hubo personas que se negaban a admitir que habían estado hablando con una máquina y no con un humano.
PARRY
PARRY es un programa similar a ELIZA creado en 1972. Sin embargo, tenía una particularidad: mientras ELIZA estaba diseñada según el modelo rogeriano, PARRY lo estaba para imitar el comportamiento de una persona con esquizofrenia paranoide.
Se realizó un experimento en el que 33 psiquiatras analizaron a un grupo de pacientes, entre los que había varios que eran máquinas con el programa PARRY instalado. El objetivo era ver si los psiquiatras podían determinar cuáles eran pacientes reales, y cuáles un programa de ordenador. El resultado fue que los psiquiatras solo acertaron en un 48% de los casos.
CyberLover
La capacidad de las inteligencias artificiales para engañar a los humanos no solo se puede medir con experimentos. Las implicaciones del test de Turing se pueden ver en la vida real, sobre todo en el entorno de internet.
Existen programas de ordenador capaces de hacerse pasar por seres humanos para engañar a los usuarios con fines maliciosos. De hecho, ya hay gran cantidad de malware que se apoya en la inteligencia artificial para hacer ingeniería social.
Un ejemplo de ello fue CyberLover, un malware que se introducía en los equipos de los usuarios y les convencía de revelar información privada. Básicamente, este programa se comportaba como un humano en busca de una relación sentimental, y no pocas personas cayeron en el engaño.
Eugene Goostman
Este es el nombre por el que se hacía pasar un chatbot que se sometió a la prueba en la Royal Society. Esta inteligencia artificial logró convencer a más del 33% de los jueces de que en realidad era un niño ucraniano de 13 años. ¿Cómo lo hizo? Entre otras cosas, hablando sobre su infancia en Odessa, su gusto por Eminem o su aversión por la saga Star Wars.
Teorías contrarias y críticas a la Prueba de Turing
Aunque el test de Turing es considerada por muchos como una prueba básica a la hora de determinar la capacidad de la inteligencia artificial para imitar el funcionamiento de la mente humana, también hay investigadores que la han criticado, o que han propuesto modelos que, supuestamente, invalidan los resultados de este experimento.
La habitación china
La habitación china es un experimento diseñado por John Searle que busca rebatir la validez del test de Turing. Searle se apoya en la creencia de que la mente humana no solo es capaz de manipular símbolos, sino de ser consciente de su significado.
Para ello propone un experimento en el que un entrevistador chino se enfrenta a una máquina capaz de entender el idioma chino. El entrevistador le haría las preguntas y la máquina sería capaz de procesar los símbolos y de ofrecer las respuestas en el idioma correcto. De esta forma, la máquina superaría el test de Turing ya que el entrevistador consideraría que la máquina entiende su idioma.
Sin embargo, Searle nos pide que imaginemos que es él quien está dentro de la máquina y será él quien responde a las preguntas. El entrevistador chino pasará las preguntas a través de una ranura. Searle no sabe ni una sola palabra en idioma chino, pero está equipado con manuales y diccionarios que (supongamos) le permiten entender los caracteres chinos y ofrecer respuestas adecuadas en función de los símbolos que entran.
De esta manera, Searle podría ser capaz de engañar al entrevistador externo y hacerle creer que sí entiende chino cuando en realidad no es así. De acuerdo a esta premisa, Searle consideraba que hacer creer algo a la audiencia y superar el test de Turing no era prueba suficiente de inteligencia.
Russell y Norvig
Los investigadores Rusell y Norvig afirmaban que superar el test de Turing solo era prueba de una capacidad de inteligencia muy restringida. Para que una máquina pudiese superar la prueba de una manera rigurosa, debería ser capaz de profundizar en otras áreas de la inteligencia artificial.
Por ejemplo, consideraban que la máquina debería ser capaz de realizar un procesamiento natural del lenguaje en cualquier idioma, que debería ofrecer puntos de vista o extraer conclusiones de las conversaciones, y que debería aprender en base a las conversaciones ya tenidas para adaptarse a nuevos escenarios (machine learning).
El Test de Turing en la cultura popular
El test de Turing ha sido mencionado de forma relativamente frecuente en la cultura popular, sobre todo en los cómics, literatura o cine de ciencia ficción.
Blade Runner
En varias escenas de Blade Runner (por ejemplo, en el inicio), se puede ver cómo el teniente Deckard realiza una prueba a individuos para saber si son androides. En este caso, la película denomina a este examen el Test Voight-Kampff, y es una prueba claramente inspirada en el test de Turing.
Código Enigma
Esta película narra de forma superficial la vida de Alan Turing y, aunque se centra más en la labor de Turing descifrando el código de Enigma, también hace algunas referencias el test. Por ejemplo, en una de las escenas le preguntan si las máquinas podrían llegar a ser capaces de pensar como un ser humano, a lo que Turing responde que “no pueden pensar como humanos… piensan como máquinas“.
Ex machina
En Ex-machina una gran empresa le encarga a un investigador realizar un test de Turing a uno de sus prototipos de androide. Sin embargo, esta prueba tiene algunas diferencias con el test original. Por un lado, el entrevistador sabe que su interlocutor es una máquina, y por otro, no hay otro interlocutor con el que comparar sus respuestas.
Un punto interesante de este nuevo enfoque del experimento que propone esta película es que surgen preguntas como que significa realmente pensar o qué es la conciencia. Por ejemplo, si el entrevistador sabe que el interlocutor es una máquina pero éste no sabe como piensa una máquina, ¿debería adaptar los resultados de la prueba teniendo en cuenta sus propios límites de conocimiento sobre el funcionamiento de un cerebro positrónico?
¿Qué opinas tú al respecto? ¿Crees que llegará el día en que sea imposible distinguir a ojos cerrados las respuestas de una máquina de las de un humano? ¿Es el test de Turing una prueba fiable o es necesario establecer pruebas más complejas para discernir entre el comportamiento humano y el de una inteligencia artificial?