Los agentes de IA solo completan el 3% del trabajo freelance, según estudio
Un estudio del Índice de Trabajo Remoto revela que los agentes de IA más avanzados solo completaron el 3% de tareas freelance simuladas, generando 1.810 dólares de los 143.991 posibles en diseño, edición y desarrollo.
Los agentes de IA solo completan un 3% de trabajos freelance
Los agentes de IA más avanzados solo completaron con éxito el 3% de las taras freelance simuladas. Un nuevo estudio del Índice de Trabajo Remoto (RLI), desarrollado por Scale AI y el Centro para la Seguridad de la IA (CAIS), evalúa la capacidad de los modelos de IA para automatizar trabajo económicamente valioso.
Resultados del experimento
Los investigadores probaron varios agentes de IA líderes en tareas freelance simuladas que incluían diseño gráfico, edición de video y desarrollo de juegos. El agente más capaz, Manus, solo pudo realizar menos del 3% del trabajo, generando 1.810 dólares de los 143.991 posibles.
Ranking de capacidades
Tras Manus, los siguientes agentes más capaces fueron Grok de xAI, Claude de Anthropic, ChatGPT de OpenAI y Gemini de Google. Los modelos aún tienen dificultades para usar diferentes herramientas y realizar tareas complejas con numerosos pasos.
Antecedentes de expectativas
Avances espectaculares en IA habían llevado a especulaciones sobre que reemplazaría a gran número de trabajadores. En marzo, el CEO de Anthropic, Dario Amodei, sugirió que el 90% del trabajo de programación se automatizaría en meses.
Implicaciones para el mercado laboral
Aunque empresas como Amazon anuncian recortes de empleo atribuidos parcialmente a la IA, el RLI indica que la IA no está preparada para asumir esos roles vacantes. Los investigadores concluyen que la automatización total del trabajo humano mediante agentes de IA aún está lejana.