La IA ya puede evadir el “test de Turing” en chats online

Durante décadas, el famoso Test de Turing fue considerado una de las grandes referencias para medir si una inteligencia artificial podía comportarse como un ser humano sin que nadie se diera cuenta. Ahora, un nuevo estudio de investigadores de la UC San Diego asegura que varios modelos de lenguaje modernos finalmente lograron superar esa prueba en conversaciones reales. Incluso algunos participantes consideraron que las respuestas de la IA parecían más humanas que las de personas reales.

El estudio, llamado Large language models pass a standard three-party Turing test, puso a prueba distintos sistemas de IA en chats en vivo donde los participantes debían descubrir quién era humano y quién no. Y, para sorpresa de muchos, algunos modelos engañaron a los usuarios con suficiente frecuencia como para superar el umbral clásico asociado al Test de Turing. El caso más llamativo fue el de GPT-4.5, que logró ser identificado como humano en el 73% de las conversaciones.

La dinámica del estudio era bastante simple. Los participantes o jueces mantenían conversaciones cortas mediante chat con dos interlocutores distintos: una persona real y un modelo de IA. Después de varios mensajes en tiempo real, tenían que decidir cuál de los dos era humano.

Lo llamativo es que algunos modelos consiguieron hacerse pasar por personas durante gran parte de las conversaciones. En ciertos casos, los participantes incluso consideraron que las respuestas de la IA parecían más “humanas” que las de las personas reales.

Si bien los participantes creyeron que GPT-4.5 era una persona real en el 73% de los casos, ese no fue el único modelo que participó de la prueba. LLaMA-3.1-405B también obtuvo números altos, alcanzando un 56%, mientras queGPT-4o y ELIZA (uno de los chatbots más antiguos de la historia) quedaron más atrás, logrando convencer a los participantes en apenas un 21% y 23% de las conversaciones respectivamente. Para los investigadores, esto representa una de las demostraciones más fuertes hasta ahora de que algunos modelos modernos ya pueden superar una versión clásica del Test de Turing.

Uno de los puntos más interesantes del estudio es que las IA no convencían a las personas por responder todo correctamente, sino por algo mucho más simple, sonar naturales. Según los investigadores, los modelos obtenían mejores resultados cuando usaban respuestas relajadas, hacían comentarios casuales, mostraban humor o incluso cometían pequeños errores durante la conversación.

El experimento incluyó más de 280 participantes y conversaciones de cinco minutos realizadas en tiempo real, siguiendo un formato bastante cercano al “juego de imitación” original que imaginó Alan Turing hace más de 70 años.

Aunque superar el Test de Turing no significa que una IA tenga conciencia propia o piense exactamente igual que un ser humano, sí demuestra algo importante: los modelos actuales cada vez son mejores imitando conversaciones humanas. Y eso abre una discusión sobre el futuro de internet, las redes sociales y la comunicación digital. Si las IA ya pueden hacerse pasar por personas reales en chats online, distinguir entre humanos y bots podría empezar a volverse mucho más difícil de lo que era hace apenas unos años.

Compartir

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *