


在 Claude Code 中运行最先进的开源模型(GLM 5.1、Kimi K2.7 Code、MiniMax M2.7 等),速度提升高达 4 倍(最高 200 tok/s),每月仅需 29 美元。几分钟即可完成设置,无需修改代码。
Edgee Turbo Models 是一项服务,可让您在 Claude Code 中运行最先进的开源模型——包括 GLM 5.1、Kimi K2.7 Code 和 MiniMax M2.7——速度比标准端点快 4 倍。只需支付固定的 29 美元/月,您就能获得高吞吐量推理基础设施,每秒可处理多达 ~200 个 token。设置只需几分钟,无需更改代码,您现有的 CLAUDE.md 和 MCP 服务器保持不变。
Turbo 变体运行在专为原始速度构建的专用高吞吐量推理基础设施上,而非共享的尽力而为端点。您将获得约 ~200 tok/s 的检测速度,大约是标准端点的 4 倍。
无需为每次代理调用支付不断攀升的封闭模型账单,您只需为所有 Turbo 模型支付一个可预测的价格。没有意外费用,无需计算 token。
将 Claude Code 指向 Edgee 并选择一个模型。无需更改代码,无需新的 SDK,无需处理 API 密钥。您的 CLAUDE.md 和 MCP 服务器保持不变——只需安装 Edgee,通过它启动 Claude Code,然后在仪表板中选择您的模型。
访问针对编码优化的开放权重模型,如 GLM 5.1(强大的工具调用能力)、Kimi K2.7 Code(专为紧凑的编辑-运行-修复循环优化的代码模型)和 MiniMax 2.7(平衡质量与吞吐量)。所有模型均作为高吞吐量 Turbo 变体提供,无需牺牲质量。
“更快和更便宜不应是取舍。”
Edgee Turbo Models 消除了速度与成本之间的经典权衡。当封闭前沿模型按 token 计费且速度约为 50 tok/s 时,Turbo 以固定月费提供可比的编码质量,速度高达 200 tok/s。速度优势在代理循环中成倍放大——一次重构可能触发数十次模型调用,每次调用节省的每一秒都会累积成每个任务节省的几分钟。
经常使用 Claude Code(或 Codex),希望在不切换工作流或按 token 付费的情况下减少延迟。如果你曾目睹一个 500 行文件以标准速度缓慢输出,或感受到封闭模型账单不断攀升的刺痛,Edgee Turbo Models 提供了一个快速、可预测的替代方案,同时保持你现有的设置不变。
其他您可能感兴趣的工具
Loading comments…
制作者
calm_kit
访问网站
edgee.ai/turbo-models
项目信息
产品关键词