


Qwen3.5 Small 是 Qwen 推出的全新模型系列,将原生多模态能力融入紧凑架构。该系列提供 0.8B、2B、4B 和 9B 四种尺寸,基于改进架构并采用规模化强化学习训练。每个变体都旨在实现超越自身参数规模的性能:最小模型针对边缘设备优化,4B 变体可作为轻量级智能体基础模型,而 9B 模型已能缩小与更大规模替代品的差距。此外,还提供基础版本供开发者从零开始微调。
系列参数范围从 0.8B 到 9B,提供清晰的升级路径。0.8B 和 2B 模型小巧快速,适合实时边缘推理;4B 模型在速度与能力间取得平衡;9B 变体则以更小体积实现接近大模型的质量。
与后期拼接视觉能力的模型不同,Qwen3.5 Small 原生支持多模态。它从一开始就协同处理图像和文本,确保模态切换时更好的对齐和更少的意外。
该系列受益于规模化 RL 训练,提升了推理、指令遵循和鲁棒性。这并非大模型的简单缩小版,而是采用现代技术专门构建的小型模型。
每种尺寸都提供基础变体(无对话调优),让开发者完全掌控微调过程。这使得该系列无需对抗内置对话格式,即可进行领域特定适配。
"9B 模型缩小了与更大模型的差距,而 0.8B 模型能在手机上运行。"
这才是真正的亮点:Qwen3.5 Small 无需您做出妥协。9B 变体的性能可媲美数倍于其规模的模型,而 0.8B 和 2B 变体则真正小巧到足以部署在边缘设备上。您无需在质量与效率之间二选一——只需为硬件选择合适尺寸。与此同时,4B 模型填补了轻量级智能体工作负载的黄金区间,在无需 7B+ 模型开销的情况下提供推理能力。
您正在资源受限的硬件上部署 AI,构建需要低成本运行的自主智能体,或只是想要一个不显小的小型多模态模型。如果您一直在等待一款兼顾边缘就绪性与真实能力的模型,Qwen3.5 Small 正是您的不二之选——无需妥协,只为任务选择最合适的尺寸。
其他您可能感兴趣的工具
Mistral 3 包含三款最先进的小型密集模型(14B、8B 和 3B),以及 Mistral Large 3——我们迄今为止能力最强的模型——这是一款稀疏混合专家模型,训练时使用了 41B 活跃参数和 675B 总参数。所有模型均依据 Apache 2.0 许可证发布。Ministral 模型在其类别中代表了最佳性能与成本比。同时,Mistral Large 3 跻身于前沿指令微调开源模型之列。
Okara 让您无需处理基础设施搭建,即可使用 30 多种强大的开源 AI 模型。像 Kimi 和 DeepSeek 这类顶级模型体积过大,无法在您的笔记本电脑上运行,我们为您代劳。在聊天中切换模型、搜索 Google、Reddit、X、YouTube,分析文件、生成图像,并与您的团队协作。所有内容均经过加密,我们绝不会利用您的数据进行训练。
TranslateGemma 是一套基于 Google Gemma 3 构建的全新开源 AI 翻译模型。它支持 55 种语言的高质量交流,兼具出色的准确性与卓越的效率。专为在移动设备、本地设备及云端环境中运行而设计,且不牺牲性能。
我们推出 PersonaPlex,这是一款全双工对话式 AI 模型,支持自然对话,并可根据需求自定义语音和角色。PersonaPlex 能够处理打断和反馈,同时保持任意选定的角色,在对话动态和任务遵循方面优于现有系统。
Loading comments…
制作者
moonbyte
访问网站
huggingface.co/collections/Qwen/qwen35
项目信息
产品关键词
成就