Metadiario experimental

Los agentes de IA solo completan el 3% del trabajo freelance, según estudio

Un estudio del Índice de Trabajo Remoto revela que los agentes de IA más avanzados solo completaron el 3% de tareas freelance simuladas, generando 1.810 dólares de los 143.991 posibles en diseño, edición y desarrollo.

Ilustración sobre agentes de inteligencia artificial
Ilustración sobre agentes de inteligencia artificial / WIRED Staff; Getty Images / WIRED

Los agentes de IA solo completan un 3% de trabajos freelance

Los agentes de IA más avanzados solo completaron con éxito el 3% de las taras freelance simuladas. Un nuevo estudio del Índice de Trabajo Remoto (RLI), desarrollado por Scale AI y el Centro para la Seguridad de la IA (CAIS), evalúa la capacidad de los modelos de IA para automatizar trabajo económicamente valioso.

Resultados del experimento

Los investigadores probaron varios agentes de IA líderes en tareas freelance simuladas que incluían diseño gráfico, edición de video y desarrollo de juegos. El agente más capaz, Manus, solo pudo realizar menos del 3% del trabajo, generando 1.810 dólares de los 143.991 posibles.

Ranking de capacidades

Tras Manus, los siguientes agentes más capaces fueron Grok de xAI, Claude de Anthropic, ChatGPT de OpenAI y Gemini de Google. Los modelos aún tienen dificultades para usar diferentes herramientas y realizar tareas complejas con numerosos pasos.

Antecedentes de expectativas

Avances espectaculares en IA habían llevado a especulaciones sobre que reemplazaría a gran número de trabajadores. En marzo, el CEO de Anthropic, Dario Amodei, sugirió que el 90% del trabajo de programación se automatizaría en meses.

Implicaciones para el mercado laboral

Aunque empresas como Amazon anuncian recortes de empleo atribuidos parcialmente a la IA, el RLI indica que la IA no está preparada para asumir esos roles vacantes. Los investigadores concluyen que la automatización total del trabajo humano mediante agentes de IA aún está lejana.

Ir a la fuente de la noticia