


Chatterbox Turbo on 350 miljoni parameetriga avatud lähtekoodiga tekst-kõneks (TTS) mudel, mis pakub kiiret ja väljendusrikast kõnesünteesi koos sisseehitatud turvafunktsioonidega. See töötab kuni 6× kiiremini kui reaalajas ühel GPU-l, latentsusega kuni 75ms — muutes selle sobivaks reaalaja rakendustele. Mudel on välja antud MIT litsentsi all ja see on esimene avatud lähtekoodiga TTS, mis sisaldab PerTh veebimärgistust igal loodud heliväljundil, tagades päritolu ja vastutuse.
Chatterbox Turbo tutvustab tekstipõhiseid silte, mis võimaldavad juhtida loomulikke häälelisi reaktsioone — sealhulgas [sigh], [gasp], [cough], [laugh], [whisper] ja [breath]. Need reaktsioonid esitatakse kloonitud häälega sama emotsionaalse tooniga, ilma et oleks vaja järeltöötlust või käsitsi heli redigeerimist.
Kloonige mis tahes hääl vaid 5 sekundi pikkusest referentshelist — pole vaja treeningut ega täpsustamist. Mudel ületab suletud lähtekoodiga mudeleid otseses võrdluses, saavutades 65,3% võidumäära ElevenLabs Turbo v2.5 vastu ja 59,1% VibeVoice 7B vastu.
Iga Chatterbox Turbo poolt loodud helifail on autenditud Resemble AI PerTh veebimärgistusega. See tagab, et saate alati kontrollida, millal sisu loodi mudeli poolt, säilitades kõrge helikvaliteedi, võimaldades samal ajal vastutust tootmisjuurutustes.
Unikaalne omadus avatud lähtekoodiga TTS-mudelite seas: reguleerige emotsionaalset intensiivsust monotoonilisest dramaatiliselt väljendusrikkaks ühe parameetriga. See annab peene kontrolli esituse üle ilma keerulist päringutehnikat nõudmata.
Ainus avatud lähtekoodiga TTS, mis ei sunni teid valima kiiruse, väljendusrikkuse ja ohutuse vahel.
Chatterbox Turbo on esimene avatud lähtekoodiga TTS-mudel, mis tarnitakse sisseehitatud PerTh veebimärgistusega vaikefunktsioonina — mitte järelmõttena. See tähendab, et arendajad saavad juurutada kiire ja väljendusrikka hääl-AI tootmises, säilitades samal ajal päritolu ja vastutuse. Kombineerituna paralingvistilise päringu ja null-lask kloonimisega vaid 5 sekundi pikkusest helist, pakub see haruldast kombinatsiooni jõudlusest, kontrollist ja usaldusväärsusest ühes MIT-litsentsiga paketis.
Vajate kiiret, avatud lähtekoodiga TTS-mudelit, mis töötab ühel GPU-l, toetab reaalajas kõnesünteesi ja sisaldab sisseehitatud turvafunktsioone. See on eriti asjakohane, kui ehitate häälassistente, interaktiivset meediat või mis tahes rakendust, kus vastutustundlik AI loodud kõne on oluline — ja soovite vältida patenteeritud lukustust või keerulisi järeltöötluse torustikke.
Teised tööriistad, mida võiksid kaaluda
Loading comments…
Looja
async_apple
KĂĽlasta veebisaiti
resemble.ai/chatterbox-turbo/
Projekti info
Toote märksõnad
Saavutus