更新时间:2026 年 5 月 18 日。这篇会长期更新。后面只要我又买了新套餐、换了主力模型、某个工具突然变好或者变坑,我都会直接改这篇,尽量保留同一个链接。

AI 编程工具主观体验榜头图

先把口径说清楚:这不是严谨跑分,也不是收钱推荐。这里写的是我自己的真实用法。我基本不手写代码,更多是把需求说给 AI,让它读项目、改网站、修 UI、写文章、跑构建、部署上线。

所以我评价一个工具,不看它宣传页写得多满,而看它能不能把我的活干完。谁能扛重活,谁适合当辅助,谁看着热闹但我不敢让它碰核心项目,这些才是这篇的重点。

01. 先给一张总表

这张表只代表我当前的使用体验,不代表模型的绝对智力。问题很简单:如果我现在继续维护这个网站,我愿意把任务交给谁?

排名工具 / 模型主观分我怎么用一句话
1Codex9.1网站主力、长任务、部署、反复修 bug慢一点,但能一直干活。
2Claude Code / Opus 4.78.8关键难题、复杂判断、卡住时攻坚聪明,但 20 刀套餐太不经用。
3Kimi Code / Kimi 2.67.3国内顺滑办公、文案、轻代码任务快是真的快,上限也是真的差点。
4GLM 5.17.2通过 CodeBuddy 等工具体验,做辅助和 Kimi 2.6 体感接近,可以用,但别神化。
5OpenCode Go6.8尝鲜国产模型、临时补位便宜时很香,中转稳定性要打问号。
6CodeBuddy6.6优惠期可用,办公任务和短任务没优惠后要仔细算积分。
7Gemini / Antigravity6.0试过,但没留下当主力视频生成可能有优势,写站这块没打动我。
8MiniMax 2.74.8买过套餐,但不放核心项目功能很多,我反而不放心。
9Trae3.8基本弃用对我这种不写代码的人太绕。

02. 真碰到难题,我先找谁

如果只看“遇到硬骨头,谁最可能一轮给我整明白”,排名会变。

  1. Claude Opus 4.7:复杂判断抓得快,像请了一个上手很熟的高手。
  2. Codex 5.5 超高智:有时候比 Claude 还猛,但也会多绕两轮。
  3. GLM 5.1 / Kimi 2.6:普通任务够用,复杂项目容易卡在同一个地方转圈。
  4. MiniMax / Gemini / Trae:目前我不会拿它们做核心攻坚。

所以我现在的实际分工不是“谁绝对最强”,而是:Codex 当主力,Claude 当尖刀。

03. 排行榜只当参照物

我会看 Arena AI Leaderboard。它的排名和我的体感大体接近:靠前的模型,复杂任务里确实更容易稳住。

但榜单不告诉你这些事:套餐够不够用、国内卡不卡、一个任务要跑几轮、工具会不会乱改文件、账号会不会突然触发风控。真正干活时,这些比榜单名次还要现实。

04. Codex:慢,但能陪我把活干完

Codex 我买的是 100 刀套餐。它最打动我的不是“最聪明”,而是适合长期干活。一个网站不是写一段代码就结束,它要改 UI、调图片、处理旧链接、跑构建、查报错、上线、再回头补细节。Codex 做这种连续任务比较稳。

它也有毛病。速度慢,开高速模式又费量。有些问题 Claude 一轮能抓住,Codex 可能要多跑两轮。但问题是它量大,能继续跑。对我来说,能把事情推完,比偶尔一轮惊艳更重要。

我这里还能用 GPT-image-2,Codex 会话里也能直接调生图。但我不太建议把生图和代码混在一个会话里干,容易把会话卡住。我的做法是:图片素材单独处理,代码和部署交给 Codex。

05. Claude Code:很聪明,也很省着用

Claude Opus 4.7 是我最愿意拿来攻坚的模型。复杂结构、关键判断、Codex 绕不出来的地方,我会让它上。

但 20 刀套餐真的太紧,尤其用 4.7,量掉得很快。我自己的体验是,一天多就能把一周额度用得差不多。所以它不适合当我这种高频改站用户的全天候工人。

我现在把它当关键部位的工具:普通问题不用它,普通 4.6 解决不了、Codex 多跑两轮还没理顺,再上 4.7。这样省一点,也更符合它的价值。

还有一点是账号风控。我不是说它一定会封,但 Claude 那种不确定感让我不太敢把整个生产流程押上去。重要内容我都会本地留备份。

06. Kimi 和 GLM:国内顺,但上限要留个心眼

Kimi 2.6 我买了 99 套餐。GLM 5.1 的官方 Code Plan 我没买到,是在腾讯 CodeBuddy 里体验的。我的感觉是,这俩差不太多:国内速度快,响应顺,写文档、改小东西、处理办公类任务够用。

但复杂项目还是差一口气。我之前拿 Kimi 2.6 和 GLM 5.1 去解决一个问题,试了很多轮一直没搞定;换 Codex 两轮就过了。这种差距在简单任务里看不出来,一到真实项目就会露出来。

所以我不会说国产模型没用。它们很适合当辅助位,尤其在国内网络环境下很舒服。但如果是我这个网站的核心修改,我还是更愿意交给 Codex 或 Claude。

07. CodeBuddy 和 OpenCode:优惠期香,长期要算账

CodeBuddy 刚开始有优惠时,我觉得还挺值。它能接入多家国产模型,做短任务、办公任务、轻量代码都可以。但没有优惠以后,积分消耗就要认真算。每月免费 500 积分基本就是体验额度,长任务跑两个可能就没了;个人专业版 58 元给 2000 积分,如果拿来当主力开发工具,未必够。

OpenCode Go 的优势是能用 Kimi、GLM 这类模型。Kimi 2.6 刚出来时有 3 倍用量,那阶段确实划算。问题是它中间有一层中转,稳定性不如直连官方;而且没有周限额缓冲,很容易一周就把一个月量干完。

这两个我都会放进工具箱,但不会放在第一优先级。

08. MiniMax:东西很多,我反而不敢交核心活

MiniMax 2.7 我买了 49 套餐。页面看着热闹,文本、图片、语音、音乐都给你摆出来,好像什么都能做。

但真实项目里,我最怕的就是“什么都能做,但不知道会不会乱做”。一个页面已经被 Codex 或 Claude 调到差不多了,我不敢让 MiniMax 接手继续改。我怕它不是帮我省时间,而是把已经好的地方改坏。

它的生图对我也不够有用,尤其中文文字这块不稳定。语音额度又没多少,我还不如自己部署 indexTTS2。最后就变成:套餐买了,功能看着多,但我很少真敢用。

09. Gemini 和 Trae:暂时没进入我的主力流程

Gemini 我试过,Antigravity 也下了。没有给我一种“这个必须留下”的感觉。以前我还用它做过一些生图,但现在选择太多,它的优势没那么明显。Veo 视频生成可能厉害,不过我视频用得少,这里不硬评。

Trae 是我最不适应的工具。它可能适合会写代码、习惯 IDE 的人,但对我这种一行代码不写的人来说太复杂。再搭配 MiniMax,我的体验就更糟。我不是说它绝对差,而是它不适合我。

10. 官网和常用入口

这些入口也同步放进了本站的网址导航。这里保留一份卡片,方便读文章时直接跳过去。

AI 编程arena.aiArena AI LeaderboardAI 模型排行榜,用来观察模型整体趋势和主观体验是否对得上。AI排行榜模型评测AI 编程chatgpt.comOpenAI Codex站点开发主力入口,适合长任务、代码修改、构建和部署。Codex代码AgentAI 编程help.openai.comCodex 套餐说明OpenAI 官方 Codex 与 ChatGPT 套餐用量说明。Codex套餐文档AI 编程claude.comClaude Code复杂问题和关键判断的攻坚工具,适合作为尖刀使用。Claude代码AgentAI 编程support.anthropic.comClaude Code 订阅说明Claude Code 在 Pro / Max 套餐中的官方使用说明。Claude套餐文档AI 编程kimi.comKimi Code国内速度顺滑的 AI 编程入口,适合办公、文案和轻量代码任务。Kimi国产模型代码AI 编程docs.z.aiGLM 5.1Z.ai 官方 GLM 5.1 文档,关注推理、Agent 和编码能力。GLM国产模型文档AI 编程copilot.tencent.comTencent CodeBuddy腾讯云 AI 编程助手,适合尝试国产模型和短任务。CodeBuddy腾讯代码AI 编程dev.opencode.aiOpenCode GoOpenCode 的 Go 计划文档,可查看可用模型和订阅说明。OpenCodeKimiGLMAI 编程minimax.ioMiniMax PricingMiniMax 套餐价格页,包含文本、语音、图像、视频等能力入口。MiniMax套餐多模态AI 编程antigravity.googleGoogle AntigravityGoogle 的 AI 编程工具入口,适合观察 Gemini 生态动向。GeminiGoogle代码AI 编程trae.aiTraeAI IDE 工具,适合对比不同编程工作流。TraeIDE代码

11. 目前我的固定分工

  • 大活先给 Codex:网站结构、跨文件修改、构建部署、长期维护。
  • 关键处问 Claude:复杂判断、疑难 bug、架构选择。
  • 轻活丢给国产模型:文案、整理、办公、短脚本。
  • 工具尝鲜别上头:优惠期可以试,别因为买了套餐就强行让它干重活。

我现在最大的体会是:AI 工具不是越多越好。真正能留下的,是你敢把下一件事继续交给它的那个。

12. 更新记录

  • 2026-05-18:换成生图头图,删掉过程讨论,官网入口统一走网址导航卡片组件。
  • 2026-05-17:初版发布,加入个人主观评分、官网入口和网址导航联动。