


Gemini 3.5 Live Translate は、Google AI Studio、Google 翻訳、Google Meet に、ほぼリアルタイムで自然な音声翻訳を提供します。
Gemini 3.5 Live Translate は、Google の最新音声モデルであり、ほぼリアルタイムで音声から音声への翻訳を実現します。70以上の言語を自動検出し、話者の本来の抑揚、テンポ、ピッチを保持した、自然で滑らかな翻訳音声を生成します。話者が話し終えるのを待ってから応答する従来のターンバイターン方式とは異なり、このモデルは継続的に音声を生成し、セッション全体を通して話者よりわずか数秒遅れるだけです。
このモデルは、音声がストリーミングされる際にそれを処理し、品質向上のためにコンテキストを待つことと、同期を保つために即座に翻訳することのトレードオフのバランスを取ります。これにより、ぎこちない間のない流暢な音声が実現します。
Gemini 3.5 Live Translate は、手動設定を必要とせずに多言語入力を処理します。70以上のオプションからソース言語を自動的に識別し、適切な翻訳を生成します。
このモデルは、騒がしく予測不可能な環境でも処理できるように設計されており、多言語通話、会議、レッスン、放送などの実用的なアプリケーションに適しています。
このモデルは、Google 製品全体で展開されます。開発者向けには Gemini Live API と Google AI Studio、エンタープライズ向けには Google Meet、消費者向けには Android と iOS の Google 翻訳アプリで利用できます。
「ぎこちない間のない流暢なオーディオを提供し、セッション全体を通して話者よりわずか数秒遅れるだけです。」
この継続的なストリーミングアプローチは、従来の翻訳システムからの根本的な転換です。完全な文が終わるのを待って応答する代わりに、Gemini 3.5 Live Translate はほぼリアルタイムで音声を生成し、会話の自然な流れを維持します。また、このモデルは話者の本来のトーンとテンポを維持するため、インタラクションがより人間らしく、ロボット的でなくなります。
多言語会議、カスタマーサポート、旅行、またはシームレスな言語間コミュニケーションが重要なあらゆるシナリオにおいて、ライブで自然な音声翻訳が必要な方。音声アプリを構築する開発者は、Gemini Live API と、Agora、LiveKit、Pipecat などのプラットフォームとのパートナー連携が、迅速な展開に特に役立つでしょう。
検討すべき他のツール
Androidでのタイピングをやめましょう。初の真にインテリジェントな音声キーボードで話し始めましょう。Typelessはあなたの自然な発話を洗練されたメッセージ、メール、ドキュメントに変換します—指でのタイピングより10倍速く。
Speak naturally, and Typeless for iOS will turn your speech into clear, polished messages, emails, and documents that read like you carefully typed them - in real time. Suddenly, your iPhone can do things that once felt impossible, effortlessly and at 10 times the speed.
Loading comments…
メーカー
calm_kit
ウェブサイトを見る
blog.google/innovation-and-ai/models-and-research/gemini-models/gemini-live-3-5-translate/
プロジェクト情報
製品キーワード