Inteligência Artificial em Xeque: Novo estudo da Mercor revela que IA de OpenAI e Google faz menos de 30% do trabalho humano especializado, mostrando os desafios da tecnologia.
A inteligência artificial (IA) tem sido frequentemente apontada como a próxima fronteira para a automação e otimização do trabalho, com projeções ambiciosas sobre sua capacidade de assumir diversas funções humanas. No entanto, um novo estudo traz uma perspectiva mais sóbria e desafiadora sobre essas expectativas.
A pesquisa indica que, mesmo os modelos de IA mais avançados, desenvolvidos por gigantes como OpenAI e Google, ainda estão longe de replicar a eficiência de profissionais humanos especializados. Eles não conseguem realizar mais de 30% das tarefas complexas exigidas no dia a dia.
Esses achados, divulgados pela empresa de recrutamento e treinamento de dados Mercor, por meio de seu novo benchmark APEX-Agents, revelam que a Inteligência Artificial tem limitações significativas em cenários de trabalho humano do mundo real.
Os Limites Revelados nos Testes da Mercor
O estudo da Mercor, utilizando seu benchmark APEX-Agents, expôs a performance dos agentes de IA em tarefas de alta complexidade. Os resultados mostraram que o GPT-5.2 da OpenAI, por exemplo, atingiu apenas 27,3% de acerto em tarefas de analistas de investimentos.
Para o setor de consultoria de gestão, o mesmo modelo da OpenAI liderou com 22,7% de respostas corretas, indicando uma dificuldade generalizada. Já em desafios impostos a advogados, o Gemini 3 Flash, do Google, obteve o melhor desempenho, com 25,9% de acerto.
Esses números são um balde de água fria para quem esperava uma rápida substituição do trabalho humano pela IA, pois mostram que a tecnologia ainda está em um estágio inicial para funções que exigem raciocínio aprofundado e contextualização.
Por Que a IA Tropeça em Tarefas Profissionais?
A principal razão para os resultados, descritos como