Hush on aat.ee

O que é o Hush?

O Hush é um modelo de supressão de ruído de código aberto desenvolvido pela weya AI que elimina ruídos de fundo, vozes concorrentes e interferências de áudio em chamadas em tempo real. Projetado especificamente para pipelines de Voice AI, o Hush limpa o áudio caótico de chamadas telefônicas na origem, transformando entradas ruidosas em fala limpa e pronta para ASR. Ele processa cada quadro de áudio de 10 ms em menos de 1 ms em CPUs padrão, mantendo as conversas fluindo sem latência. Com apenas 8 MB, o modelo é leve o suficiente para ser implantado em sua própria nuvem ou data center, e ficou entre os 5 principais modelos de aprimoramento de fala no ranking Audio-to-Audio do Hugging Face no lançamento.

Para quem é

Desenvolvedores de Voice AI — que constroem agentes ou bots que precisam de reconhecimento de fala confiável a partir de chamadas reais ruidosas.
Equipes de contact center — que buscam melhorar a compreensão de agentes e bots em ambientes com trânsito, barulho de escritório ou falantes sobrepostos.
Gerentes de conformidade e garantia de qualidade — que precisam de gravações de áudio limpas para transcrição e análise precisas.

Principais recursos

Processamento em tempo real na CPU

O Hush processa cada quadro de áudio de 10 ms em menos de 1 ms em CPUs padrão, mantendo as chamadas rápidas sem necessidade de GPUs. Isso o torna prático para execução em escala sem atualizações de hardware caras.

Foco na voz certa

O modelo isola o chamador principal e empurra conversas de fundo, ruídos de TV e outras vozes concorrentes para o lado. Os sistemas ASR ouvem a pessoa que importa, reduzindo erros devido à fala sobreposta.

Construído para lugares barulhentos

O Hush lida com trânsito, barulho de escritório, ventiladores e sons de rua, mantendo as chamadas compreensíveis mesmo nos piores ruídos do dia a dia. Foi treinado em mais de 10.000 horas de áudio ruidoso do mundo real, incluindo falantes sobrepostos e ambientes difíceis.

O que se destaca

O Hush corrige o sinal da chamada na origem, transformando áudio caótico de telefone em fala limpa e pronta para ASR.

A maioria das falhas de Voice AI vem de áudio ruim, não de modelos ruins. O Hush aborda isso diretamente, limpando a entrada antes que ela chegue ao seu pipeline de reconhecimento de fala. Sua natureza de código aberto significa que você pode implantá-lo livremente, inspecionar o código e integrá-lo em pilhas existentes sem dependência de fornecedor. A combinação de tamanho minúsculo do modelo (8 MB), desempenho em tempo real apenas com CPU e classificação comprovada em rankings o torna uma base prática para qualquer sistema de Voice AI.

Vale a pena conferir se…

Você constrói ou opera agentes de Voice AI que lidam com chamadas telefônicas do mundo real — especialmente em ambientes ruidosos como ruas movimentadas, cafés ou escritórios abertos. O Hush também vale a pena ser explorado se você deseja reduzir erros de ASR, melhorar a compreensão de agentes ou limpar gravações de chamadas para conformidade sem adicionar custos de GPU. Sua licença de código aberto e pegada leve o tornam uma adição de baixo risco a qualquer pipeline de áudio.

Hush

Hush

Sobre Hush

O que é o Hush?

Para quem é

Principais recursos

Processamento em tempo real na CPU

Foco na voz certa

Construído para lugares barulhentos

O que se destaca

Vale a pena conferir se…

Produtos relacionados

Comentários

Supercut for Agents

Slideshot

MCP Bridge by Appfactor

ZeroGPU