


O Qwen3.5 Small é uma nova série de modelos da Qwen que traz capacidades multimodais nativas para arquiteturas compactas. Lançada em quatro tamanhos — 0,8B, 2B, 4B e 9B — esta família é construída sobre uma arquitetura aprimorada com aprendizado por reforço em escala. Cada variante foi projetada para superar seu peso: os modelos menores são otimizados para dispositivos de borda, a variante de 4B serve como uma base leve para agentes, e o modelo de 9B já reduz a diferença para alternativas muito maiores. Versões base também estão disponíveis para desenvolvedores que preferem ajustar o modelo do zero.
A série abrange de 0,8B a 9B parâmetros, oferecendo um caminho claro de atualização. Os modelos de 0,8B e 2B são minúsculos e rápidos, ideais para inferência em tempo real na borda. O modelo de 4B equilibra velocidade e capacidade, enquanto a variante de 9B entrega qualidade próxima a modelos grandes em uma fração do tamanho.
Diferente de modelos que adicionam visão posteriormente, o Qwen3.5 Small é nativamente multimodal. Ele processa imagens e texto juntos desde o início, o que garante melhor alinhamento e menos surpresas ao alternar entre modalidades.
A série se beneficia de treinamento RL em escala, que melhora o raciocínio, o seguimento de instruções e a robustez. Não se trata apenas de uma versão menor de um modelo maior — é um modelo pequeno propositalmente construído com técnicas modernas.
Cada tamanho vem com uma variante Base (sem ajuste de chat) para desenvolvedores que desejam controle total sobre o ajuste fino. Isso torna a série adequada para adaptação a domínios específicos sem lutar contra a formatação de chat embutida.
"O modelo de 9B reduz a diferença para modelos muito maiores, enquanto o de 0,8B roda em um celular."
Essa é a verdadeira história aqui: o Qwen3.5 Small não exige que você faça concessões. A variante de 9B oferece desempenho que rivaliza com modelos várias vezes maiores, enquanto as variantes de 0,8B e 2B são genuinamente pequenas o suficiente para implantação na borda. Você não está escolhendo entre qualidade e eficiência — está escolhendo o tamanho certo para seu hardware. O modelo de 4B, por sua vez, preenche um ponto ideal para cargas de trabalho leves de agentes, onde você precisa de raciocínio sem a sobrecarga de um modelo de 7B+.
Você está implantando IA em hardware com recursos limitados, construindo agentes autônomos que precisam rodar de forma econômica, ou simplesmente quer um modelo multimodal pequeno que não pareça pequeno. O Qwen3.5 Small é especialmente relevante se você estava esperando por um modelo que equilibre prontidão para borda com capacidade genuína — sem concessões, apenas o tamanho certo para o trabalho.
Outras ferramentas que você pode considerar
Loading comments…
Criador
moonbyte
Visitar site
huggingface.co/collections/Qwen/qwen35
Informações do projeto
Palavras-chave do produto
Conquista