


Kimi K2.7 Code est le dernier modèle agentique axé sur le codage de Moonshot AI, conçu pour l'ingénierie logicielle à long terme, avec un contexte de 256K, une utilisation d'outils en plusieurs étapes, des entrées multimodales, et une consommation de jetons de raisonnement environ 30 % inférieure à celle de K2.6. Disponible dans Kimi Code, Kimi API, ainsi qu'en poids/code ouverts.
Kimi K2.7 Code est le dernier modèle agentique de Moonshot AI, spécialisé dans le codage et conçu pour les tâches d'ingénierie logicielle à long horizon. Il prend en charge une fenêtre de contexte de 256K, l'utilisation d'outils en plusieurs étapes et les entrées multimodales, tout en utilisant environ 30 % de tokens de raisonnement en moins que son prédécesseur, K2.6. Le modèle est disponible via Kimi Code, l'API Kimi, ainsi qu'en poids et code ouverts, ce qui le rend accessible à la fois pour l'expérimentation et le déploiement en production.
Le modèle peut traiter et raisonner sur 256 000 tokens en une seule passe, ce qui lui permet de gérer des bases de code entières, une documentation volumineuse ou des conversations à plusieurs tours sans troncature. Cela le rend idéal pour des tâches comme le refactoring de grands projets ou le débogage à travers de nombreux fichiers.
Avec 1 billion de paramètres au total et 32 milliards de paramètres activés par token, Kimi K2.7 Code utilise une conception Mixture-of-Experts qui équilibre performance et efficacité. Il sélectionne 8 experts parmi 384 par token, offrant des résultats solides tout en maintenant des coûts de calcul gérables.
Le modèle accepte à la fois du texte et des images, ce qui lui permet d'interpréter des captures d'écran, des diagrammes ou des notes manuscrites dans le cadre d'une tâche de codage. Cela est particulièrement utile pour convertir des maquettes d'interface utilisateur en code ou pour déboguer des problèmes visuels à partir de captures d'écran d'erreurs.
Kimi K2.7 Code est publié sous une licence ouverte, avec les poids et le code d'inférence disponibles sur Hugging Face. Vous pouvez l'exécuter localement en utilisant Docker, vLLM, SGLang ou Transformers, ce qui vous donne un contrôle total sur le déploiement et la confidentialité des données.
"Kimi K2.7 Code réduit l'utilisation des tokens de raisonnement de 30 % tout en améliorant les performances de codage à long horizon dans le monde réel."
Ce gain d'efficacité n'est pas seulement une amélioration de benchmark — il se traduit directement par des réponses plus rapides et des coûts opérationnels réduits pour les systèmes de production. Combiné avec le contexte de 256K et la publication en poids ouverts, le modèle offre une combinaison rare d'échelle, de transparence et d'utilisabilité pratique que peu de modèles de codage actuels égalent.
Vous construisez ou maintenez des pipelines d'ingénierie logicielle complexes et avez besoin d'un modèle capable de gérer des tâches de raisonnement longues et multi-étapes sans faire exploser les coûts en tokens. Kimi K2.7 Code est également un excellent choix si vous accordez de l'importance à l'accès aux poids ouverts pour l'auto-hébergement ou la personnalisation, ou si vos workflows impliquent des entrées multimodales comme des captures d'écran et des diagrammes en plus du code.
D'autres outils que vous pourriez envisager
Loading comments…
Créateur
indie_inkwell
Visiter le site web
huggingface.co/moonshotai/Kimi-K2.7-Code
Infos du projet
Mots-clés du produit
Alternatives