Fim do Canvas? ChatGPT agora cria imagens com texto de forma mais precisa

Nova funcionalidade usa GPT-4o e promete gerar imagens com mais fidelidade em atributos visuais e textos; versão gratuita também terá acesso limitado

Repórter

Publicado em 25 de março de 2025 às 15h42.

Última atualização em 25 de março de 2025 às 15h49.

A OpenAI anunciou nesta terça-feira, 25, a liberação da geração de imagens dentro do ChatGPT, com a nova função batizada de “Images in ChatGPT”. A novidade utiliza o modelo GPT-4o, sigla para omnimodal, capaz de gerar diferentes tipos de dados — texto, imagem, áudio e vídeo.

A criação de imagens estará disponível para todos os planos do ChatGPT, incluindo a versão gratuita, que seguirá os mesmos limites de uso do DALL·E 3.

A nova tecnologia traz ganhos técnicos. O principal avanço está na capacidade de "binding", termo usado para descrever a habilidade do modelo em manter coerência entre atributos e objetos. Modelos anteriores falhavam em comandos com múltiplas variáveis visuais —, frequentemente trocando as cores ou omitindo elementos.

O novo sistema consegue representar de forma precisa até 20 objetos distintos por imagem, contra os 5 a 8 de modelos anteriores.

Outro ponto de evolução é a renderização de texto em imagens, desafio frequente em IA visual. Em testes, o sistema mostrou-se mais capaz de gerar palavras legíveis e com menos erros ortográficos, o que é essencial para conteúdos como cartazes, menus e logos.

Modelo sequencial gera imagens como se estivesse escrevendo

A arquitetura usada no novo gerador se diferencia dos modelos de difusão como o DALL·E. Em vez de criar a imagem como um todo, o sistema da OpenAI usa um método autorregressivo, construindo a imagem linha por linha, da esquerda para a direita e de cima para baixo — de forma semelhante à escrita de um texto.

A empresa também destacou a utilidade prática do recurso em materiais como adesivos com fundo transparente e cardápios personalizados.

Para contornar possíveis maus usos, a OpenAI diz ter implementado filtros para bloquear usos indevidos como deepfakes sexuais e pedidos relacionados a exploração infantil. A geração de imagens também impede a remoção de marcas d’água.

Apesar disso, as imagens não contarão com marcas visuais explícitas indicando que são feitas por IA. Em vez disso, todas trarão metadados no padrão C2PA, consórcio criado para identificar conteúdos digitais autênticos

Acompanhe tudo sobre:Inteligência artificial ChatGPT

Nova IA do Alibaba roda em computador comum e entende vídeos de 1 hora

Mais de Inteligência Artificial

Parceiras da OpenAI já acumulam dívida de US$ 100 bi em projetos

Mais na Exame

Imagem referente à matéria: Onde investir o 13º? Veja o que fazer com o dinheiro ‘extra’

Minhas Finanças

Inteligência Artificial

Fim do Canvas? ChatGPT agora cria imagens com texto de forma mais precisa

Nova funcionalidade usa GPT-4o e promete gerar imagens com mais fidelidade em atributos visuais e textos; versão gratuita também terá acesso limitado

Modelo sequencial gera imagens como se estivesse escrevendo

Mais de Inteligência Artificial

Parceiras da OpenAI já acumulam dívida de US$ 100 bi em projetos

Órgão regulador do Reino Unido ameaça fusão entre Getty Images e Shutterstock

Baidu busca se tornar fornecedora completa de IA no mercado chinês

Alibaba lança óculos com IA e mira competição contra a Meta

Mais na Exame

Onde investir o 13º? Veja o que fazer com o dinheiro ‘extra’

Vale viajar no Ano Novo? As cidades mais baratas e mais caras do Brasil

Cathie Wood reafirma previsão de bitcoin em US$ 1,5 milhão mesmo após queda da criptomoeda

Desmatamento reduz em até 75% a caça na Amazônia, diz estudo