Hush on aat.ee

Qu'est-ce que Hush ?

Hush est un modèle de suppression de bruit open source développé par weya AI qui élimine les bruits de fond, les voix concurrentes et les interférences audio des appels en temps réel. Conçu spécifiquement pour les pipelines Voice AI, Hush nettoie l'audio chaotique des appels téléphoniques à la source, transformant une entrée bruyante en parole propre et prête pour la reconnaissance automatique de la parole (ASR). Il traite chaque trame audio de 10 ms en moins de 1 ms sur des processeurs standard, maintenant ainsi le flux des conversations sans latence. Avec seulement 8 Mo, le modèle est suffisamment léger pour être déployé dans votre propre cloud ou centre de données, et il s'est classé parmi les 5 meilleurs modèles d'amélioration de la parole sur le leaderboard Audio-to-Audio de Hugging Face lors de son lancement.

À qui s'adresse-t-il ?

Développeurs Voice AI — construisant des agents ou des bots nécessitant une reconnaissance vocale fiable à partir d'appels réels bruyants.
Équipes de centres de contact — cherchant à améliorer la compréhension des agents et des bots dans des environnements avec circulation, bruit de bureau ou locuteurs qui se chevauchent.
Responsables de conformité et d'assurance qualité — ayant besoin d'enregistrements audio propres pour une transcription et une analyse précises.

Fonctionnalités clés

Traitement CPU en temps réel

Hush traite chaque trame audio de 10 ms en moins de 1 ms sur des processeurs standard, garantissant ainsi la rapidité des appels sans nécessiter de GPU. Cela le rend pratique à déployer à grande échelle sans mises à niveau matérielles coûteuses.

Se concentre sur la bonne voix

Le modèle isole l'appelant principal et repousse les conversations de fond, le bruit de la télévision et autres voix concurrentes. Les systèmes ASR entendent la personne importante, réduisant ainsi les erreurs dues à la parole qui se chevauche.

Hush

Hush

À propos de Hush

Qu'est-ce que Hush ?

À qui s'adresse-t-il ?

Fonctionnalités clés

Traitement CPU en temps réel

Se concentre sur la bonne voix

Conçu pour les endroits bruyants

Ce qui le distingue

À considérer si…

Produits associés

Supercut for Agents

Slideshot

MCP Bridge by Appfactor

ZeroGPU

Commentaires