
Mistral 3는 Mistral이 선보이는 차세대 오픈 멀티모달 및 다국어 AI 모델입니다. 이번 릴리스에는 세 가지 최첨단 소형 밀집 모델(14B, 8B, 3B 파라미터)과 지금까지 가장 강력한 모델인 Mistral Large 3가 포함됩니다. Mistral Large 3는 41B 활성 파라미터와 675B 전체 파라미터로 학습된 희소 혼합 전문가(MoE) 모델입니다. 모든 모델은 Apache 2.0 라이선스로 배포되어 개발자에게 최첨단 AI 기능에 대한 개방형 액세스를 제공합니다.
Mistral Large 3는 Mixtral 시리즈 이후 Mistral의 첫 번째 혼합 전문가 모델로, 3,000개의 NVIDIA H200 GPU에서 처음부터 학습되었습니다. 일반 프롬프트에서 최고의 명령어 튜닝 오픈웨이트 모델과 동등한 성능을 달성하면서 이미지 이해 능력과 다국어 대화에서 최고 수준의 성능을 보여줍니다.
Ministral 3 시리즈는 3B, 8B, 14B의 세 가지 크기로 제공되며 기본, 명령어, 추론 변형이 포함되어 있습니다. 각각 기본 멀티모달 및 다국어 기능을 갖추고 있습니다. 이 모델들은 해당 카테고리의 모든 오픈소스 모델 중 최고의 비용 대비 성능 비율을 제공합니다.
가장 작은 3B 변형부터 대규모 Large 3까지 모든 Mistral 3 모델은 Apache 2.0 라이선스로 배포됩니다. 여기에는 기본 버전과 명령어 미세 조정 버전이 모두 포함되어 엔터프라이즈 및 개발자 커뮤니티 전반에 걸친 추가 커스터마이징을 위한 강력한 기반을 제공합니다.
Mistral은 NVIDIA, vLLM, Red Hat과 협력하여 효율적인 추론 지원을 제공합니다. Large 3는 vLLM을 사용하여 단일 8×A100 또는 8×H100 노드에서 실행되며, Ministral 모델은 데이터 센터에서 로봇에 이르기까지 DGX Spark, RTX PC, 노트북 및 Jetson 디바이스에 원활하게 배포됩니다.
"Mistral Large 3는 최첨단 명령어 미세 조정 오픈소스 모델 대열에 합류했으며, Ministral 시리즈는 해당 카테고리에서 최고의 성능 대비 비용 비율을 제공합니다."
이 이중 릴리스는 대규모 클라우드 기반 MoE 모델부터 소형 엣지 최적화 밀집 모델에 이르기까지 AI 배포의 전체 스펙트럼을 단일 허용적 라이선스 하에 포괄한다는 점에서 주목할 만합니다. Mistral Large 3는 LMArena 리더보드의 OSS 비추론 모델 카테고리에서 2위로 데뷔했으며, Ministral 3 시리즈는 비용 효율적인 로컬 AI의 새로운 기준을 제시합니다.
성능, 비용 및 배포 유연성의 균형을 갖춘 오픈웨이트 모델이 필요하다면 Mistral 3가 적합합니다. 다국어 애플리케이션을 구축하거나, 엣지 디바이스에 AI를 배포하거나, 자유롭게 커스터마이징할 수 있는 최첨단 MoE 모델을 원한다면 Mistral 3가 이상적입니다. Apache 2.0 라이선스와 광범위한 하드웨어 지원 덕분에 엔터프라이즈 및 커뮤니티 프로젝트 모두에 강력한 선택이 됩니다.
고려해볼 만한 다른 도구
Loading comments…
제작자
moonbyte
웹사이트 방문
mistral.ai/news/mistral-3
프로젝트 정보
제품 키워드
비교
성과