Inteligência Artificial em Xeque: Novo estudo da Mercor revela que IA de OpenAI e Google faz menos de 30% do trabalho humano especializado, mostrando os desafios da tecnologia.

A inteligência artificial (IA) tem sido frequentemente apontada como a próxima fronteira para a automação e otimização do trabalho, com projeções ambiciosas sobre sua capacidade de assumir diversas funções humanas. No entanto, um novo estudo traz uma perspectiva mais sóbria e desafiadora sobre essas expectativas.

A pesquisa indica que, mesmo os modelos de IA mais avançados, desenvolvidos por gigantes como OpenAI e Google, ainda estão longe de replicar a eficiência de profissionais humanos especializados. Eles não conseguem realizar mais de 30% das tarefas complexas exigidas no dia a dia.

Esses achados, divulgados pela empresa de recrutamento e treinamento de dados Mercor, por meio de seu novo benchmark APEX-Agents, revelam que a Inteligência Artificial tem limitações significativas em cenários de trabalho humano do mundo real.

Os Limites Revelados nos Testes da Mercor

O estudo da Mercor, utilizando seu benchmark APEX-Agents, expôs a performance dos agentes de IA em tarefas de alta complexidade. Os resultados mostraram que o GPT-5.2 da OpenAI, por exemplo, atingiu apenas 27,3% de acerto em tarefas de analistas de investimentos.

Para o setor de consultoria de gestão, o mesmo modelo da OpenAI liderou com 22,7% de respostas corretas, indicando uma dificuldade generalizada. Já em desafios impostos a advogados, o Gemini 3 Flash, do Google, obteve o melhor desempenho, com 25,9% de acerto.

Esses números são um balde de água fria para quem esperava uma rápida substituição do trabalho humano pela IA, pois mostram que a tecnologia ainda está em um estágio inicial para funções que exigem raciocínio aprofundado e contextualização.

Por Que a IA Tropeça em Tarefas Profissionais?

A principal razão para os resultados, descritos como

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *

Você também pode gostar

Grok de Elon Musk: IA gera 6.700 imagens sexuais ilegais por hora no X, acendendo alerta sobre deepfakes

A inteligência artificial Grok, desenvolvida pela xAI de Elon Musk e integrada…

JBL Live Beam 3: Fones com tela na case e ANC adaptativo entram em promoção com 44% de desconto no Mercado Livre

JBL Live Beam 3 em oferta: Tecnologia de ponta com preço reduzido…

Revolução da IA: Como a Apple Perde Poder de Barganha com a TSMC e Isso Pode Encarecer o Próximo iPhone

O boom da Inteligência Artificial está redefinindo o poder no mercado de…

Óculos Smart Viram Ferramenta de Provocação e Assédio Online: Ray-Ban Meta Gera Polêmica com Gravações Virais no TikTok e Instagram

Uma nova e preocupante tendência tem ganhado força nas redes sociais, onde…