
Hush supprime les voix concurrentes, les bruits de fond et les interférences audio des appels en temps réel afin que vos agents vocaux IA entendent toujours ce qui compte.
Hush est un modèle de suppression de bruit open source développé par weya AI qui élimine les bruits de fond, les voix concurrentes et les interférences audio des appels en temps réel. Conçu spécifiquement pour les pipelines Voice AI, Hush nettoie l'audio chaotique des appels téléphoniques à la source, transformant une entrée bruyante en parole propre et prête pour la reconnaissance automatique de la parole (ASR). Il traite chaque trame audio de 10 ms en moins de 1 ms sur des processeurs standard, maintenant ainsi le flux des conversations sans latence. Avec seulement 8 Mo, le modèle est suffisamment léger pour être déployé dans votre propre cloud ou centre de données, et il s'est classé parmi les 5 meilleurs modèles d'amélioration de la parole sur le leaderboard Audio-to-Audio de Hugging Face lors de son lancement.
Hush traite chaque trame audio de 10 ms en moins de 1 ms sur des processeurs standard, garantissant ainsi la rapidité des appels sans nécessiter de GPU. Cela le rend pratique à déployer à grande échelle sans mises à niveau matérielles coûteuses.
Le modèle isole l'appelant principal et repousse les conversations de fond, le bruit de la télévision et autres voix concurrentes. Les systèmes ASR entendent la personne importante, réduisant ainsi les erreurs dues à la parole qui se chevauche.
Hush gère la circulation, le bruit de bureau, les ventilateurs et les sons de la rue, rendant les appels compréhensibles même dans les pires environnements quotidiens. Il a été entraîné sur plus de 10 000 heures d'audio bruyant réel, incluant des locuteurs qui se chevauchent et des environnements difficiles.
Hush corrige le signal d'appel à la source, transformant l'audio téléphonique chaotique en parole propre et prête pour l'ASR.
La plupart des échecs de Voice AI proviennent d'un mauvais audio, pas de mauvais modèles. Hush aborde ce problème directement en nettoyant l'entrée avant qu'elle n'atteigne votre pipeline de reconnaissance vocale. Sa nature open source signifie que vous pouvez le déployer librement, inspecter le code et l'intégrer dans des piles existantes sans dépendre d'un fournisseur. La combinaison d'une taille de modèle minuscule (8 Mo), de performances en temps réel uniquement sur CPU et d'un classement éprouvé sur le leaderboard en fait une base pratique pour tout système Voice AI.
Vous construisez ou gérez des agents Voice AI qui traitent des appels téléphoniques réels — en particulier dans des environnements bruyants comme les rues animées, les cafés ou les bureaux ouverts. Hush vaut également la peine d'être exploré si vous souhaitez réduire les erreurs ASR, améliorer la compréhension des agents ou nettoyer les enregistrements d'appels pour la conformité sans ajouter de coûts GPU. Sa licence open source et son empreinte légère en font un ajout à faible risque pour toute pipeline audio.
D'autres outils que vous pourriez envisager
Le Supercut MCP offre à vos assistants IA/de codage un accès respectueux des autorisations aux enregistrements, incluant la recherche sémantique, les transcriptions, les images, les commentaires, les réactions, et bien plus encore.
Donnez à votre agent IA un parcours produit à enregistrer. Slideshot pilote votre application web via MCP, capture la démonstration, et renvoie une vidéo de démo soignée ainsi qu'un GIF avec des zooms, des mouvements de curseur et une animation d'introduction personnalisée. Aucun enregistrement ni montage manuel nécessaire.
Branchez MCP Bridge à n'importe quelle API REST, GraphQL, SOAP ou gRPC. Il génère automatiquement des définitions d'outils MCP avec des schémas typés, l'authentification, la limitation de débit et le traitement des réponses. Vos agents LLM accèdent aux API d'entreprise via une interface standard unique.
Le monde ne peut pas construire de capacité de calcul assez rapidement pour suivre la demande en IA. Nous avons donc emprunté une voie différente. ZeroGPU est une infrastructure IA alimentée par de petits modèles de langage fonctionnant sur un réseau hybride en périphérie, réutilisant la puissance de calcul déjà existante. Toutes les tâches n'ont pas besoin d'un modèle de pointe. Nos modèles spécialisés et optimisés pour la périphérie sont 10 fois plus rapides, 50 % moins chers et déchargent 70 à 80 % des tâches de production vers de petits modèles avec une précision de niveau supérieur.
Loading comments…
Créateur
neon_dev
Infos du projet
Mots-clés du produit