
Mistral 3 es la próxima generación de modelos de IA multimodales y multilingües de código abierto de Mistral. Esta versión incluye tres modelos densos pequeños de última generación (14B, 8B y 3B parámetros) y Mistral Large 3, el modelo más potente hasta la fecha, un modelo disperso de mezcla de expertos (MoE) entrenado con 41B parámetros activos y 675B parámetros totales. Todos los modelos se publican bajo la licencia Apache 2.0, brindando a los desarrolladores acceso abierto a capacidades de IA de vanguardia.
Mistral Large 3 es el primer modelo de mezcla de expertos de Mistral desde la serie Mixtral, entrenado desde cero en 3,000 GPU NVIDIA H200. Alcanza la paridad con los mejores modelos de pesos abiertos ajustados por instrucciones en indicaciones generales, demostrando comprensión de imágenes y un rendimiento líder en conversaciones multilingües.
La serie Ministral 3 está disponible en tres tamaños (3B, 8B y 14B) con variantes base, instruct y de razonamiento, cada una con capacidades multimodales y multilingües nativas. Estos modelos ofrecen la mejor relación costo-rendimiento de cualquier modelo de código abierto en su categoría.
Cada modelo de Mistral 3, desde la variante más pequeña de 3B hasta el enorme Large 3, se publica bajo la licencia Apache 2.0. Esto incluye tanto las versiones base como las ajustadas por instrucciones, proporcionando una base sólida para una mayor personalización en comunidades empresariales y de desarrolladores.
Mistral se asoció con NVIDIA, vLLM y Red Hat para ofrecer soporte de inferencia eficiente. Large 3 se ejecuta en un solo nodo 8×A100 o 8×H100 usando vLLM, mientras que los modelos Ministral se implementan sin problemas en DGX Spark, PC con RTX, portátiles y dispositivos Jetson, desde el centro de datos hasta el robot.
"Mistral Large 3 se une a las filas de los modelos de código abierto ajustados por instrucciones de vanguardia, mientras que la serie Ministral ofrece la mejor relación rendimiento-costo en su categoría."
Esta doble publicación es notable porque cubre todo el espectro de implementación de IA, desde modelos MoE masivos en la nube hasta modelos densos pequeños optimizados para el borde, todo bajo una misma licencia permisiva. Mistral Large 3 debuta en el puesto #2 en la categoría de modelos sin razonamiento de OSS en el ranking LMArena, mientras que la serie Ministral 3 establece un nuevo estándar para la IA local rentable.
Necesitas modelos de pesos abiertos que equilibren rendimiento, costo y flexibilidad de implementación. Mistral 3 es ideal si estás creando aplicaciones multilingües, implementando IA en dispositivos de borde o deseas un modelo MoE de vanguardia que puedas personalizar libremente. La licencia Apache 2.0 y el amplio soporte de hardware lo convierten en una opción sólida tanto para proyectos empresariales como comunitarios.
Otras herramientas que podrías considerar
Okara te permite usar más de 30 potentes modelos de IA de código abierto sin tener que lidiar con la configuración de infraestructura. Los mejores modelos como Kimi y DeepSeek son demasiado grandes para ejecutarlos en tu portátil, nosotros nos encargamos de eso por ti. Cambia entre modelos, busca en Google, Reddit, X, YouTube desde tus chats, analiza archivos, genera imágenes y trabaja con tu equipo. Todo está cifrado y nunca entrenamos con tus datos.
TranslateGemma es una nueva suite de modelos de traducción de IA abiertos basados en Gemma 3 de Google. Permite una comunicación de alta calidad en 55 idiomas, combinando una gran precisión con una eficiencia excepcional. Diseñada para funcionar en dispositivos móviles, locales y entornos en la nube sin comprometer el rendimiento.
We introduce PersonaPlex, a full-duplex conversational AI model that enables natural conversations with customizable voices and roles. PersonaPlex handles interruptions and backchannels while maintaining any chosen persona, outperforming existing systems on conversational dynamics and task adherence.
¿Qué es 1Code? Una aplicación para ejecutar tus agentes de Claude Code en paralelo que funciona en Mac y Web. En Mac - ejecuta localmente, con o sin worktrees. En Web - ejecuta en sandboxes remotos con vistas previas en vivo de tu aplicación, incluida la versión móvil, para que puedas supervisar los agentes desde cualquier lugar. Ejecutar múltiples Claude Codes en paralelo aceleró drásticamente la forma en que desarrollamos funciones.
Loading comments…
Creador
moonbyte
Información del proyecto
Palabras clave del producto