A "alma" dos robôs: o modelo de V-JEPA 2 promete dar entendimento sobre o mundo real às máquinas (picture alliance/Getty Images)
Redação Exame
Publicado em 11 de junho de 2025 às 14h22.
Última atualização em 11 de junho de 2025 às 14h24.
A Meta anunciou nesta quarta-feira, 11, o lançamento do V-JEPA 2, seu novo modelo de inteligência artificial open-source capaz de compreender ambientes tridimensionais e prever movimentos de objetos físicos. A promessa é transformar a forma, como máquinas como robôs de entrega e carros autônomos, interagem com o mundo real.
Chamado de world model, ou “modelo de mundo”, o sistema usa princípios da física para criar simulações internas da realidade, permitindo que a IA entenda e planeje ações como se tivesse uma espécie de “gêmeo digital” do mundo ao seu dispor.
O V-JEPA 2, por exemplo, é capaz de prever que uma bola rolando de uma mesa irá cair, ou que um objeto fora de vista continua existindo, algo natural para humanos, mas desafiador para algoritmos.
Segundo a empresa, o grande diferencial do V-JEPA 2 está em sua forma de aprendizado: em vez de depender de enormes quantidades de dados rotulados, como vídeos ou imagens com descrições, o sistema opera em um espaço latente simplificado, com foco em inferência e previsão de interações físicas.
“Permitir que máquinas entendam o mundo físico é muito diferente de ensiná-las a entender linguagem”, disse Yann LeCun, cientista-chefe de IA da Meta, em uma apresentação na conferência Viva Tech, em Paris. Para ele, um modelo de mundo permite que uma IA "preveja as consequências de suas ações" e, assim, possa planejar com mais eficiência.
Enquanto chatbots como o ChatGPT, da OpenAI, e o Gemini, do Google, dominam as discussões públicas, o avanço dos world models atrai cada vez mais atenção entre especialistas do setor. A ideia de criar IAs que compreendam o espaço, o tempo e as leis da física representa a próxima fronteira após os grandes modelos de linguagem (LLMs).
Esse movimento já atraiu figuras como Fei-Fei Li, uma das principais pesquisadoras da área, que captou US$ 230 milhões em 2023 para fundar a World Labs, startup dedicada à criação de modelos de mundo em larga escala. Do outro lado, o Google também aposta nessa rota com o Genie, projeto da DeepMind que simula jogos e ambientes em 3D em tempo real.
Para a Meta, a estreia do V-JEPA 2 serve tanto como marco tecnológico quanto como peça estratégica: além de investir US$ 14 bilhões na Scale AI, a empresa também deve contratar o CEO da companhia, Alexandr Wang, como parte de sua ofensiva no setor.
Com a IA cada vez mais próxima do mundo físico, o futuro da computação pode estar menos nas palavras — e mais nos movimentos.