Un estudio reciente publicado en la revista Scientific Reports sugiere que los chatbots de IA de modelo de lenguaje grande (LLM) pueden superar al humano promedio en tareas creativas como la lluvia de ideas sobre usos alternativos para elementos comunes, un reflejo del pensamiento divergente. Sin embargo, las personas que lograron las puntuaciones más altas en estas tareas aún superaron los resultados del chatbot con mejor rendimiento.
El pensamiento divergente es un tipo de proceso de pensamiento a menudo vinculado a la creatividad, que enfatiza la generación de muchas ideas o soluciones diferentes para una tarea específica.
Comúnmente se evalúa con la Tarea de Usos Alternativos (AUT), en la que se pide a los participantes que encuentren tantos usos alternativos como sea posible para un objeto cotidiano en un corto período de tiempo. Las respuestas se califican en cuatro categorías diferentes: fluidez, flexibilidad, originalidad y elaboración.
Mika Koivisto y Simone Grassini compararon las respuestas de 256 participantes humanos con las de tres chatbots de IA (ChatGPT3, ChatGPT4 y Copy.Ai) a AUT para cuatro objetos: una cuerda, una caja, un lápiz y una vela. Los autores evaluaron la originalidad de las respuestas clasificándolas en términos de distancia semántica (qué tan estrechamente relacionada estaba la respuesta con el uso original del objeto) y creatividad.
Se utilizó un método computacional para cuantificar la distancia semántica en una escala de 0 a 2, mientras que los evaluadores humanos, ciegos a los autores de las respuestas, calificaron subjetivamente la creatividad del 1 al 5. En promedio, las respuestas generadas por el chatbot obtuvieron puntuaciones significativamente más altas que las humanas. respuestas tanto para la distancia semántica (0,95 frente a 0,91) como para la creatividad (2,91 frente a 2,47).
Las respuestas humanas tuvieron un rango mucho más amplio en ambas medidas: las puntuaciones mínimas fueron mucho más bajas que las respuestas de la IA, pero las puntuaciones máximas fueron generalmente más altas. La mejor respuesta humana superó a la mejor respuesta de cada chatbot en siete de las ocho categorías de puntuación.
Estos hallazgos sugieren que los chatbots de IA ahora pueden generar ideas creativas al menos tan bien como el ser humano promedio. Sin embargo, los autores señalan que sólo consideraron el desempeño en una única tarea asociada con la evaluación de la creatividad. Los autores proponen que investigaciones futuras podrían explorar cómo se puede integrar la IA en el proceso creativo para mejorar el desempeño humano.
Referencia: “Los mejores humanos aún superan a la inteligencia artificial en una tarea de pensamiento divergente creativo” por Mika Koivisto y Simone Grassini, 14 de septiembre de 2023, Scientific Reports.
DOI: 10.1038/s41598-023-40858-3
El estudio fue financiado por la Universidad de Bergen.