


Gemini 3.5 Live Translate toob peaaegu reaalajas ja loomuliku kõnetõlke Google AI Studio'sse, Google Translate'i ja Google Meet'i.
Gemini 3.5 Live Translate on Google'i uusim helimudel, mis võimaldab peaaegu reaalajas kõnest kõnesse tõlkimist. See tuvastab automaatselt üle 70 keele ja genereerib sujuva, loomuliku kõlaga tõlgitud kõne, mis säilitab kõneleja algse intonatsiooni, tempo ja helikõrguse. Erinevalt vanematest samm-sammult süsteemidest, mis ootavad kõneleja lõpetamist enne vastamist, genereerib see mudel kõnet pidevalt – jäädes seansi jooksul kõnelejast vaid mõne sekundi võrra maha.
Mudel töötleb kõnet selle voogedastamise ajal, tasakaalustades kompromissi konteksti ootamise vahel kvaliteedi parandamiseks ja kohese tõlkimise vahel, et püsida sünkroonis. See tagab sujuva heli ilma ebamugavate pausideta.
Gemini 3.5 Live Translate haldab mitmekeelseid sisendeid ilma käsitsi seadistamist nõudmata. See tuvastab automaatselt lähtekeele üle 70 võimaliku hulgast ja genereerib sobiva tõlke.
Mudel on loodud töötama valjude ja ettearvamatute keskkondadega, muutes selle sobivaks reaalsete rakenduste jaoks, nagu mitmekeelsed kõned, koosolekud, tunnid ja saated.
Mudel võetakse kasutusele Google'i toodetes: arendajatele Gemini Live API ja Google AI Studio kaudu, ettevõtetele Google Meetis ja tarbijatele Google Translate'i rakenduses nii Androidis kui ka iOS-is.
"See tagab sujuva heli ilma ebamugavate pausideta ja jääb seansi jooksul kõnelejast vaid mõne sekundi võrra maha."
See pidev voogedastusega lähenemine on põhimõtteline nihe traditsioonilistest tõlkesüsteemidest. Selle asemel, et oodata enne vastamist tervet lauset, genereerib Gemini 3.5 Live Translate kõnet peaaegu reaalajas, säilitades vestluse loomuliku voolu. Mudel säilitab ka kõneleja algse tooni ja tempo, muutes suhtluse inimlikumaks ja vähem robotlikuks.
Vajate reaalajas, loomuliku kõlaga kõnetõlget mitmekeelseteks koosolekuteks, klienditoeks, reisimiseks või muudeks stsenaariumideks, kus sujuv keelteülene suhtlus on oluline. Häälrakendusi loovad arendajad leiavad Gemini Live API ja partnerite integratsioonid platvormidega nagu Agora, LiveKit ja Pipecat eriti kasulikuks kiireks juurutamiseks.
Teised tööriistad, mida võiksid kaaluda
Loading comments…
Looja
calm_kit
KĂĽlasta veebisaiti
blog.google/innovation-and-ai/models-and-research/gemini-models/gemini-live-3-5-translate/
Projekti info
Toote märksõnad