IA para golfinhos: pesquisadores trabalham para associar padrões com sons sintéticos criados para se referir a objetos que golfinhos gostam (Stuart Westmorland/Getty Images)
Repórter
Publicado em 15 de abril de 2025 às 07h05.
Última atualização em 15 de abril de 2025 às 11h42.
Uma nova inteligência artificial (IA) criada pelo Google quer ajudar a "traduzir" o idioma dos golfinhos. Chamada de DolphinGemma, o modelo de linguagem visa entender a estrutura das vocalizações desses mamíferos marinhos, identificando padrões e sequências nos sons emitidos pelos golfinhos, e, a longo prazo, criar um vocabulário compartilhado entre humanos e golfinhos.
Esses sons são processados por uma arquitetura de modelo projetada para lidar com sequências complexas, permitindo que o sistema identifique padrões, estruturas e até mesmo preveja os próximos sons na sequência, assim como os modelos de linguagem humana preveem a próxima palavra ou token.
Com cerca de 400 milhões de parâmetros, o modelo foi projetado para ser executado diretamente nos smartphones Pixel usados pelos pesquisadores em campo.
A implementação do DolphinGemma já começou nesta temporada de pesquisa e permite identificar padrões recorrentes de sons, agrupamentos e sequências confiáveis, facilitando a descoberta de estruturas ocultas na comunicação dos golfinhos. Com isso, a carga de trabalho humana necessária para analisar essas informações complexas é significativamente reduzida, segundo o Google.
Além disso, os pesquisadores estão trabalhando para associar esses padrões com sons sintéticos criados para se referir a objetos que os golfinhos gostam, como algas e fitoplâncton. A ideia é estabelecer um vocabulário compartilhado com os golfinhos, permitindo uma comunicação mais interativa.
A inteligência artificial DolphinGemma, desenvolvida pelo Google em parceria com a Georgia Tech e o Wild Dolphin Project (WDP), utiliza tecnologias de ponta para analisar e interagir com a complexa comunicação dos golfinhos.
O DolphinGemma foi treinado utilizando uma base de dados extensiva, composta por décadas de gravações de áudio e vídeo feitas pelo WDP nas Bahamas.
Essas gravações documentam as vocalizações, interações, comportamentos e até as identidades individuais dos golfinhos-pintados-do-Atlântico. A partir dessa rica fonte de dados, a IA aprende a identificar os padrões presentes nas vocalizações dos golfinhos e pode prever sequências sonoras, de forma similar aos modelos de linguagem que antecipam palavras ou tokens na comunicação humana.
A base do funcionamento do DolphinGemma é a tecnologia SoundStream, que é responsável por transformar as vocalizações dos golfinhos em representações digitais chamadas tokens. Esses tokens são então analisados pela IA, que identifica os padrões e a estrutura desses sons. O modelo conta com cerca de 400 milhões de parâmetros, o que o torna altamente eficiente para processar a complexidade das vocalizações dos golfinhos, permitindo uma análise mais precisa e previsível.
Uma das inovações do DolphinGemma é a capacidade de rodar em smartphones Google Pixel, o que facilita a implementação e o uso da IA diretamente no campo. Isso permite que os pesquisadores, durante as expedições no ambiente marinho, possam realizar a coleta e a análise dos sons dos golfinhos em tempo real, sem a necessidade de equipamentos especializados e volumosos. Essa abordagem simplifica a operação e torna a tecnologia mais acessível e prática para pesquisas em áreas remotas.
Além de decifrar os sons naturais dos golfinhos, o DolphinGemma está integrado ao sistema subaquático CHAT (Cetacean Hearing Augmentation Telemetry).
O CHAT foi projetado para associar sons sintéticos a objetos específicos que os golfinhos gostam, como ervas marinhas ou outros itens encontrados no oceano. Com o tempo, espera-se que os golfinhos aprendam a imitar esses sons para solicitar os objetos desejados, criando assim uma forma básica de comunicação entre humanos e golfinhos.
A interação bidirecional entre golfinhos e pesquisadores é um dos aspectos mais promissores do projeto. Através da imitação de sons, os golfinhos podem "pedir" objetos específicos ou reagir a comandos simples.
O DolphinGemma não só facilita a análise e compreensão dos sons naturais dos golfinhos, mas também pode ser um passo crucial para a criação de uma forma de comunicação entre seres humanos e esses mamíferos marinhos. Com a implementação do sistema CHAT e o aprimoramento contínuo da IA, a expectativa é que os golfinhos mais curiosos se envolvam ainda mais com o sistema, melhorando a comunicação bidirecional e possibilitando interações mais fluidas e naturais.
Em 2025, o Google planeja disponibilizar o DolphinGemma como um modelo aberto, permitindo que pesquisadores de todo o mundo apliquem a tecnologia em outras espécies de cetáceos e continuar a explorar o potencial dessa inovação na comunicação com mamíferos marinhos.