
O Hush elimina vozes concorrentes, ruídos de fundo e interferências de áudio em chamadas em tempo real para que seus agentes de IA de voz sempre ouçam o que realmente importa.
O Hush é um modelo de supressão de ruído de código aberto desenvolvido pela weya AI que elimina ruídos de fundo, vozes concorrentes e interferências de áudio em chamadas em tempo real. Projetado especificamente para pipelines de Voice AI, o Hush limpa o áudio caótico de chamadas telefônicas na origem, transformando entradas ruidosas em fala limpa e pronta para ASR. Ele processa cada quadro de áudio de 10 ms em menos de 1 ms em CPUs padrão, mantendo as conversas fluindo sem latência. Com apenas 8 MB, o modelo é leve o suficiente para ser implantado em sua própria nuvem ou data center, e ficou entre os 5 principais modelos de aprimoramento de fala no ranking Audio-to-Audio do Hugging Face no lançamento.
O Hush processa cada quadro de áudio de 10 ms em menos de 1 ms em CPUs padrão, mantendo as chamadas rápidas sem necessidade de GPUs. Isso o torna prático para execução em escala sem atualizações de hardware caras.
O modelo isola o chamador principal e empurra conversas de fundo, ruídos de TV e outras vozes concorrentes para o lado. Os sistemas ASR ouvem a pessoa que importa, reduzindo erros devido à fala sobreposta.
O Hush lida com trânsito, barulho de escritório, ventiladores e sons de rua, mantendo as chamadas compreensíveis mesmo nos piores ruídos do dia a dia. Foi treinado em mais de 10.000 horas de áudio ruidoso do mundo real, incluindo falantes sobrepostos e ambientes difíceis.
O Hush corrige o sinal da chamada na origem, transformando áudio caótico de telefone em fala limpa e pronta para ASR.
A maioria das falhas de Voice AI vem de áudio ruim, não de modelos ruins. O Hush aborda isso diretamente, limpando a entrada antes que ela chegue ao seu pipeline de reconhecimento de fala. Sua natureza de código aberto significa que você pode implantá-lo livremente, inspecionar o código e integrá-lo em pilhas existentes sem dependência de fornecedor. A combinação de tamanho minúsculo do modelo (8 MB), desempenho em tempo real apenas com CPU e classificação comprovada em rankings o torna uma base prática para qualquer sistema de Voice AI.
Você constrói ou opera agentes de Voice AI que lidam com chamadas telefônicas do mundo real — especialmente em ambientes ruidosos como ruas movimentadas, cafés ou escritórios abertos. O Hush também vale a pena ser explorado se você deseja reduzir erros de ASR, melhorar a compreensão de agentes ou limpar gravações de chamadas para conformidade sem adicionar custos de GPU. Sua licença de código aberto e pegada leve o tornam uma adição de baixo risco a qualquer pipeline de áudio.
Outras ferramentas que você pode considerar
Loading comments…
Criador
neon_dev
Visitar site
weya.ai/hush
Informações do projeto
Palavras-chave do produto