Escrito por Cassidy Luong
En un experimento audaz, investigadores de la Universidad Carnegie Mellon se propusieron responder una gran pregunta: ¿puede la inteligencia artificial (IA) hacerse completamente cargo de las operaciones de una empresa? Para averiguarlo, crearon una empresa de software ficticia en la que todos los empleados eran agentes de IA. Estos agentes ocuparon roles reales dentro de la empresa—como analistas financieros, gerentes de proyectos, desarrolladores de software y diseñadores—pero ningún humano formaba parte del equipo. Todo era gestionado y ejecutado por modelos de IA conocidos como GPT-4o, Claude, Gemini, Llama y otros.
Al principio, la idea parecía emocionante. Después de todo, muchas empresas ya utilizan IA para ayudar con el servicio al cliente, el análisis de datos y la redacción de textos. Si la IA pudiera dirigir una empresa por completo, esto podría significar trabajos más rápidos, menores costos y menos errores humanos. Pero los resultados del experimento mostraron algo muy diferente.
Durante el estudio, se pidió a los agentes de IA que completaran 48 tareas distintas relacionadas con la gestión de una empresa de software. No eran tareas extremadamente complicadas—incluían planificación, redacción de correos electrónicos, diseño de presentaciones, investigación de información y organización de documentos. Sin embargo, más del 75% de estas tareas no se completaron o se hicieron de forma incorrecta. Incluso el modelo con mejor desempeño, Claude 3.5 Sonnet, logró completar completamente solo el 24% de las tareas. Si se incluye el trabajo parcialmente hecho, llegó apenas al 34%. Otros modelos tuvieron un rendimiento aún peor: Gemini 2.0 Flash completó solo alrededor del 11% de las tareas.
Entonces, ¿por qué fracasó el experimento?
Hubo varias razones. En primer lugar, muchos agentes de IA no podían seguir instrucciones a menos que estuvieran escritas en un lenguaje muy claro y específico. En los entornos de trabajo reales, se espera que los empleados puedan manejar tareas incluso cuando las instrucciones no son perfectas. En segundo lugar, los modelos de IA tenían dificultades para utilizar herramientas digitales básicas. Por ejemplo, no sabían cómo abrir o editar correctamente un documento de Word, ni cómo navegar por una página web que tuviera ventanas emergentes. Estas son cosas que los humanos hacen con facilidad todos los días.
Otro gran problema fue el trabajo en equipo. Los agentes a menudo se malinterpretaban entre ellos, no compartían bien la información y tomaban decisiones basadas en suposiciones incorrectas. A veces omitían pasos importantes o asumían que una tarea estaba terminada solo porque una parte se había completado. En un caso, el agente que hacía de gerente de proyecto aprobó un diseño que ni siquiera se había creado aún. Estos errores provocaron muchos trabajos inconclusos o de baja calidad.
Este experimento no fue el único de su tipo. Otros investigadores también han intentado pruebas similares con agentes de IA trabajando en proyectos de software o tareas creativas. En la mayoría de los casos, los resultados también han sido decepcionantes. Aunque las herramientas de IA son útiles como apoyo para los trabajadores humanos, aún no están preparadas para asumir toda la responsabilidad por sí solas.
Lo que esto nos dice sobre la IA en el mundo laboral
La idea de que la IA reemplace a los trabajadores humanos suena futurista y eficiente, pero estos experimentos demuestran que todavía no estamos en ese punto. La IA puede ser una asistente poderosa, pero todavía carece del juicio, la flexibilidad y las habilidades de colaboración que los humanos aportan a un equipo. Lo más importante es que la IA no “entiende” realmente las tareas como lo hacen las personas—solo puede adivinar en función de patrones de datos.
Por ahora, la IA debe verse como una herramienta para apoyar el trabajo humano, no para reemplazarlo. Las empresas deben ser cautelosas y realistas al decidir cuánta responsabilidad darle a la IA. Los trabajadores humanos siguen siendo esenciales—no solo para hacer el trabajo, sino para asegurarse de que se haga bien.
Fuentes
Martínez, Alberto. “Unos investigadores crearon una empresa cuyos empleados eran agentes de IA: no hicieron ni una cuarta parte del trabajo.” Xataka, 4 julio 2025. Consultado el 7 de julio de 2025.
Huffington Post España. “Montan una empresa con empleados creados por IA: el resultado dice mucho sobre el futuro del trabajo, según los investigadores.” Huffington Post, 5 julio 2025. Consultado el 7 de julio de 2025.