
Kodwai 是首个评估你与 AI 编程代理(Claude Code、Cursor、Codex)协作能力的平台。在终端中解决真实挑战;CLI 会记录你的代码、测试、Git 历史、代理对话记录及时间,然后从三个维度为你打分:方向、成果与提升,每个维度均附有具体依据。登上公开排行榜、赢取徽章,并打造一份展示你工程能力而非记忆力的个人档案。免费使用,自带代理即可。
Kodwai 是首个评估你与 Claude Code、Cursor、Codex 等 AI 编程代理协作能力的平台。它不测试你的记忆能力,而是衡量你通过真实编程挑战引导代理的能力。你在自己的终端中解决问题,CLI 会捕获你的代码、测试、Git 历史、代理对话记录和时间。平台随后从三个维度——方向、成果和提升——为你打分,每个维度都有具体证据支撑。它完全免费,且你可以使用自己的代理。
Kodwai 提供按类别划分的工单式问题,涵盖你实际交付的内容。你可以浏览、选择一个,然后运行一条 CLI 命令,它会下载问题、初始文件和测试,初始化 Git 仓库并启动计时器。没有沙盒,没有人为限制——只有你自己的编辑器和代理。
你的会话按方向(你引导代理的能力)、成果(实际交付的内容)和提升(代理相对于你基准线的改进程度)进行评分。每个维度都有对应的信号证据,让你清楚了解得分原因。
你的分数会出现在公开排行榜上,你可以与其他开发者的氛围编程技能进行比较。通过成就获得徽章,打造展示你工程能力而非记忆能力的个人档案。
Kodwai 支持 Claude Code、Cursor 和 Codex。你可以选择最熟悉的代理,平台会根据你使用的工具评估你们的协作效果。
"通过测试不代表有技能。Kodwai 会读取整个会话,因此分数奖励的是你的引导能力。"
一个粗心的一次性提示可能让测试套件变绿,但 Kodwai 能捕捉到差异。它会读取整个会话——你的提示、代理的对话记录、你的验证步骤,以及当代理自信地犯错时你如何纠正。这意味着,一个仔细分解问题并逐步验证的开发者,得分会高于仅靠运气发送提示的人。
你厌倦了 LeetCode 和白板题,这些题目 AI 代理几秒钟就能解决。如果你想要一个真正反映你如何引导代理、捕捉幻觉并验证交付内容的指标,Kodwai 会给你一个证明你判断力的分数。它完全免费,在你的机器上运行,并支持你已使用的代理。
其他您可能感兴趣的工具
当智能体需要部署某些内容时,它会直接撞上为人类设计的壁垒。今天,我们在 Cloudflare Workers 上推出了临时账户功能。现在,任何智能体都可以运行 wrangler deploy — temporary,在几秒内获得一个实时 Worker。
Supercut MCP 让您的 AI/编程助手能够以权限感知的方式访问录制内容,包括语义搜索、转录文本、画面帧、评论、反应等。
基于树的导航、语义重构、代码库分析以及语言移植工具,适用于支持 163 种语法规则的编码代理。
在 Claude Code 中运行最先进的开源模型(GLM 5.1、Kimi K2.7 Code、MiniMax M2.7 等),速度提升高达 4 倍(最高 200 tok/s),每月仅需 29 美元。几分钟即可完成设置,无需修改代码。
Loading comments…
制作者
sleepyfox
访问网站
kodwai.com
项目信息
产品关键词