


O Gemini 3.5 Live Translate oferece tradução de fala natural quase em tempo real para o Google AI Studio, Google Translate e Google Meet.
O Gemini 3.5 Live Translate é o mais recente modelo de áudio do Google para tradução de fala em tempo real. Ele detecta automaticamente mais de 70 idiomas e gera uma fala traduzida suave e com som natural, preservando a entonação, o ritmo e o tom originais do falante. Ao contrário dos sistemas antigos de turno por turno, que esperam o falante terminar para responder, este modelo gera fala continuamente — mantendo-se apenas alguns segundos atrás do falante durante toda a sessão.
O modelo processa a fala conforme ela é transmitida, equilibrando a compensação entre esperar por contexto para melhorar a qualidade e traduzir imediatamente para manter a sincronia. Isso oferece áudio fluido sem pausas estranhas.
O Gemini 3.5 Live Translate lida com entradas multilíngues sem exigir configuração manual. Ele identifica automaticamente o idioma de origem entre mais de 70 opções e gera a tradução adequada.
O modelo foi projetado para lidar com ambientes barulhentos e imprevisíveis, tornando-o adequado para aplicações do mundo real, como chamadas multilíngues, reuniões, aulas e transmissões.
O modelo é implementado nos produtos do Google: para desenvolvedores, por meio da Gemini Live API e do Google AI Studio; para empresas, no Google Meet; e para consumidores, no aplicativo Google Tradutor no Android e iOS.
"Ele oferece áudio fluido sem pausas estranhas e permanece apenas alguns segundos atrás do falante durante toda a sessão."
Essa abordagem de streaming contínuo é uma mudança fundamental em relação aos sistemas de tradução tradicionais. Em vez de esperar por uma frase completa antes de responder, o Gemini 3.5 Live Translate gera fala em tempo real, preservando o fluxo natural da conversa. O modelo também mantém o tom e o ritmo originais do falante, tornando as interações mais humanas e menos robóticas.
Você precisa de tradução de fala ao vivo e com som natural para reuniões multilíngues, suporte ao cliente, viagens ou qualquer cenário onde a comunicação perfeita entre idiomas seja importante. Desenvolvedores que criam aplicativos de voz acharão a Gemini Live API e as integrações com parceiros como Agora, LiveKit e Pipecat especialmente úteis para uma implantação rápida.
Outras ferramentas que você pode considerar
Loading comments…
Criador
calm_kit
Visitar site
blog.google/innovation-and-ai/models-and-research/gemini-models/gemini-live-3-5-translate/
Informações do projeto
Palavras-chave do produto