


Voxtral Transcribe 2 on Mistrali järgmise põlvkonna kõnest-teksti mudeliperekond, mis pakub ülikiiret ja väga täpset transkriptsiooni reaalajas võimekuse ja kõnelejate tuvastamisega. See hõlmab kahte mudelit: Voxtral Mini Transcribe V2 partiitöötluseks ja Voxtral Realtime reaalajas rakenduste jaoks. Koos toetavad need 13 keelt, sõnade ajatempleid, konteksti suunamist ja privaatsusele keskendunud juurutamist – kõike seda tööstusharu juhtiva kiiruse ja kuluga.
Spetsiaalselt reaalajas transkriptsiooniks loodud Voxtral Realtime kasutab uudset voogedastusarhitektuuri, mis transkribeerib heli selle saabumisel. See pakub konfigureeritavat latentsust kuni alla 200 ms, võimaldades häileagente peaaegu võrguühenduseta täpsusega. 480 ms viivitusega jääb see 1–2% sõnaveamäära piiresse, sobitudes reaalajas rakenduste jaoks partiikvaliteediga.
See partiimudel saavutab tipptasemel transkriptsioonikvaliteedi umbes 4% sõnaveamääraga FLEURS võrdlusalusel ja hinnaga $0,003 minutis. See ületab GPT-4o mini Transcribe, Gemini 2.5 Flash, Assembly Universal ja Deepgram Nova täpsuses, töödeldes heli umbes 3 korda kiiremini kui ElevenLabs’i Scribe v2 viiendiku kuluga.
Looge transkriptsioone kõnelejate siltide ja täpsete algus- ja lõpuaegadega, mis sobivad ideaalselt koosolekute, intervjuude ja mitme osalejaga kõnede jaoks. Konteksti suunamine võimaldab teil esitada kuni 100 sõna või fraasi, et suunata mudelit nimede, tehniliste terminite või valdkonnapõhise sõnavara õigekirja suunas.
Voxtral Realtime tarnitakse Apache 2.0 litsentsi all, mida saab juurutada ääreseadmetes privaatsusele keskendunud rakenduste jaoks. Mõlemad mudelid toetavad algselt 13 keelt, sealhulgas inglise, hiina, hindi, hispaania, araabia, prantsuse, portugali, vene, saksa, jaapani, korea, itaalia ja hollandi keelt.
Voxtral Transcribe 2 pakub madalaimat sõnaveamäära madalaima hinnaga, reaalajas latentsusega kuni alla 200 ms.
See täpsuse, kiiruse ja kulutõhususe kombinatsioon on praegusel turul võrratu. Voxtral Mini Transcribe V2 saavutab tipptasemel transkriptsiooni hinnaga $0,003 minutis, samas kui Voxtral Realtime võimaldab uut tüüpi häilepõhiseid rakendusi voogedastusarhitektuuriga, mis ei tee kvaliteedis järeleandmisi. Avatud kaalude väljalaskmine Apache 2.0 litsentsi all eristab seda veelgi, võimaldades privaatsustundlikke juurutusviise ääreseadmetes.
Vajate kõnest-teksti lahendust, mis tasakaalustab ülimadalat latentsust, kõrget täpsust ja kulutõhusust – eriti reaalajas häileagentide, reaalajas transkriptsiooni või privaatsusele keskendunud rakenduste jaoks. Avatud kaaludega mudel ja mitmekeelne tugi muudavad selle tugevaks valikuks arendajatele, kes loovad erinevatel platvormidel ja keeltes.
Teised tööriistad, mida võiksid kaaluda
Loading comments…
Looja
async_apple
KĂĽlasta veebisaiti
mistral.ai/news/voxtral-transcribe-2
Projekti info
Toote märksõnad
Saavutus