


Qwen3.5 Small es una nueva serie de modelos de Qwen que incorpora capacidades multimodales nativas en arquitecturas compactas. Lanzada en cuatro tamaños — 0.8B, 2B, 4B y 9B — esta familia se basa en una arquitectura mejorada con aprendizaje por refuerzo a escala. Cada variante está diseñada para rendir por encima de su categoría: los modelos más pequeños están optimizados para dispositivos periféricos, la variante de 4B sirve como base ligera para agentes, y el modelo de 9B ya reduce la brecha con alternativas mucho más grandes. También están disponibles versiones base para desarrolladores que prefieran ajustar el modelo desde cero.
La serie abarca desde 0.8B hasta 9B de parámetros, ofreciendo una ruta de actualización clara. Los modelos de 0.8B y 2B son pequeños y rápidos, ideales para inferencia en tiempo real en dispositivos periféricos. El modelo de 4B equilibra velocidad y capacidad, mientras que la variante de 9B ofrece calidad cercana a modelos grandes en una fracción del tamaño.
A diferencia de modelos que añaden visión posteriormente, Qwen3.5 Small es multimodal de forma nativa. Procesa imágenes y texto juntos desde el principio, lo que garantiza una mejor alineación y menos sorpresas al cambiar entre modalidades.
La serie se beneficia de un entrenamiento con RL a escala, que mejora el razonamiento, el seguimiento de instrucciones y la robustez. No es solo una versión más pequeña de un modelo grande, sino un modelo pequeño diseñado específicamente y entrenado con técnicas modernas.
Cada tamaño incluye una variante Base (sin ajuste conversacional) para desarrolladores que deseen control total sobre el ajuste fino. Esto hace que la serie sea adecuada para la adaptación a dominios específicos sin tener que lidiar con el formato de chat integrado.
"El modelo de 9B reduce la brecha con modelos mucho más grandes, mientras que el de 0.8B funciona en un teléfono."
Esa es la verdadera novedad: Qwen3.5 Small no te obliga a hacer concesiones. La variante de 9B ofrece un rendimiento que rivaliza con modelos varias veces más grandes, mientras que las variantes de 0.8B y 2B son lo suficientemente pequeñas para el despliegue en dispositivos periféricos. No tienes que elegir entre calidad y eficiencia, sino el tamaño adecuado para tu hardware. El modelo de 4B, por su parte, ocupa un punto óptimo para cargas de trabajo ligeras de agentes donde se necesita razonamiento sin la sobrecarga de un modelo de 7B+.
Estás implementando IA en hardware con recursos limitados, construyendo agentes autónomos que necesitan funcionar de forma económica, o simplemente buscas un modelo multimodal pequeño que no se sienta pequeño. Qwen3.5 Small es especialmente relevante si has estado esperando un modelo que equilibre preparación para dispositivos periféricos con capacidad real — sin concesiones, solo el tamaño adecuado para el trabajo.
Otras herramientas que podrías considerar
Loading comments…
Creador
moonbyte
Visitar sitio web
huggingface.co/collections/Qwen/qwen35
Información del proyecto
Palabras clave del producto
Logro