AI Agent 工作流工具对比:grill-me、Trellis 与 Superpowers
本文根据 grill-me skill、Trellis 和 Superpowers 的公开说明整理,重点比较它们的定位、优势、配置方式和适用场景。
AI 编程工具真正难用的地方,通常不是“模型会不会写代码”,而是它是否能稳定理解你的项目、追问不清楚的需求、保留团队规范、验证结果,并在下一次会话继续沿着同一套工程标准工作。
grill-me、Trellis 和 Superpowers 都在解决这个问题,但层级不同:
grill-me是单个 productivity skill,重点是把一个计划问透。- Trellis 是 npm CLI + 项目级框架,把 specs、tasks、memory 写进仓库。
- Superpowers 是一整套 agent 开发方法论和技能集合,强调设计、TDD、调试、验证和子代理执行。
快速结论
| 工具 | 类型 | 最适合 |
|---|---|---|
| grill-me | 单个 skill | 需求不清、方案需要被追问和压测 |
| Trellis | 项目级框架 | 团队项目、长期项目、多 agent 平台共享规范 |
| Superpowers | 方法论 + 技能集合 | 想给 coding agent 套完整工程流程 |
简单说:
- 想让 agent 先把你问清楚,用
grill-me。 - 想把项目规范、任务和记忆沉淀在仓库里,用 Trellis。
- 想让 agent 自动遵循设计、计划、TDD、debug、review、验证流程,用 Superpowers。
grill-me
grill-me 的内容很短,但定位非常明确:让 AI relentlessly interview 你,直到双方对计划或设计达成共同理解。
它的核心规则是:
- 一次只问一个问题。
- 每个问题都给出推荐答案。
- 沿着设计决策树逐个分支追问。
- 如果问题能通过阅读代码库回答,就让 agent 自己去查代码,而不是继续问用户。
优势
grill-me 的优势在于轻量和直接。它不要求你改变项目结构,也不要求安装一整套框架,只是在关键决策前把需求问清楚。
适合这些场景:
- 你有一个粗略想法,但还没形成可执行方案。
- 你担心方案遗漏边界条件。
- 你希望 AI 像评审一样不断追问你。
- 你不想一上来就写完整 PRD 或实施计划。
例如你可以这样使用:
Use grill-me to challenge this plan before we implement it.
或者:
grill me on this deployment design until all risk branches are resolved.
配置方式
grill-me 本质上是一份 skill 文件。配置方式取决于你使用的 agent 平台。
通用做法是把它保存到支持 skills 的目录里,例如:
skills/productivity/grill-me/SKILL.md
文件内容包含:
name: grill-me
description: Interview the user relentlessly about a plan or design until reaching shared understanding.
如果你的 agent 支持从 GitHub skill 仓库安装,可以直接引用来源:
https://github.com/mattpocock/skills/blob/main/skills/productivity/grill-me/SKILL.md
局限
grill-me 不负责完整工程执行。它不会自动创建 PRD、任务目录、项目记忆,也不会强制测试或代码审查。它更像一个“需求拷问器”,不是项目管理系统。
Trellis
Trellis 的定位是“out-of-the-box engineering framework for AI coding”。它通过 npm CLI 初始化项目,把规范、任务和记忆放进仓库,让不同 coding agent 都能读取同一套工程上下文。
官方说明里最重要的几个目录是:
.trellis/spec/:项目规范和团队约定。.trellis/tasks/:PRD、实现上下文、评审上下文和任务状态。.trellis/workspace/:工作日志和项目记忆。
优势
Trellis 最大的优势是项目级持久化。很多 agent 会话的问题是“每次都从零开始”,Trellis 则把高价值上下文写进 repo。
它适合:
- 长期项目。
- 多人协作项目。
- 团队希望共享 AI 编程规范。
- 同一个项目会在多个 agent 平台之间切换。
- 需要把任务状态、PRD、检查记录留在仓库里。
官方 README 强调 Trellis 支持多平台 setup,让同一套结构服务于多个 AI coding 平台,而不是每个工具单独维护一份规则。
配置方式
前置要求:
Node.js >= 18
Python >= 3.9
安装:
npm install -g @mindfoldhq/trellis@latest
在仓库里初始化:
trellis init -u your-name
如果你明确使用 Cursor、OpenCode、Codex 等平台,可以初始化时指定:
trellis init --cursor --opencode --codex -u your-name
初始化后,Trellis 会把项目规则、任务和工作区记忆放进 .trellis/。这些文件可以像普通代码一样提交、review 和演进。
工作流
Trellis 的流程可以理解为四段:
- Plan:通过
trellis-brainstorm一次一个问题澄清需求,生成prd.md。 - Implement:
trellis-implement子代理按 PRD 写代码。 - Verify:
trellis-check对照 specs 检查 diff,并运行 lint、type-check、tests。 - Finish:完成后归档任务,并把新经验更新回
.trellis/spec/。
官方还提到完成或上下文快满时可以使用:
/trellis:finish-work
局限
Trellis 会引入明显的项目结构。对一次性小任务来说,它可能显得偏重。它也要求团队愿意维护 .trellis/ 下的规范文件,否则框架存在但上下文质量不高。
另外,Trellis 的许可是 AGPL-3.0。团队在企业或闭源场景使用前,需要自行确认合规要求。
Superpowers
Superpowers 是一套完整的软件开发方法论,建立在 composable skills 和初始指令之上。它的目标不是单独解决一个问题,而是让 agent 在合适时自动触发对应流程。
官方 README 里的基本工作流包括:
- brainstorming:写代码前先澄清想法,提出设计并让用户确认。
- using-git-worktrees:创建隔离工作区。
- writing-plans:把设计拆成明确任务。
- subagent-driven-development / executing-plans:按计划执行。
- test-driven-development:红绿重构。
- requesting-code-review:任务之间做代码审查。
- finishing-a-development-branch:完成后选择合并、PR、保留或丢弃。
优势
Superpowers 的优势是完整和强约束。它强调:
- 不清楚需求时先 brainstorm。
- 不靠猜测修 bug,而是 systematic debugging。
- 不在未验证前宣称完成。
- 用 TDD 和 code review 约束实现质量。
- 用 subagent 分工处理较大的开发任务。
它适合:
- 经常让 agent 参与复杂代码实现。
- 希望减少“AI 写完但没验证”的情况。
- 想把 TDD、debug、review 变成默认行为。
- 需要 agent 在长任务中保持纪律。
配置方式
Superpowers 的安装方式随 agent 平台不同而不同。
Codex CLI 中,官方 README 说明可以通过插件界面安装:
/plugins
然后搜索:
superpowers
选择 Install Plugin。
Claude Code 可以通过插件 marketplace:
/plugin install superpowers@claude-plugins-official
也可以添加 Superpowers marketplace 后安装:
/plugin marketplace add obra/superpowers-marketplace
/plugin install superpowers@superpowers-marketplace
Gemini CLI:
gemini extensions install https://github.com/obra/superpowers
GitHub Copilot CLI:
copilot plugin marketplace add obra/superpowers-marketplace
copilot plugin install superpowers@superpowers-marketplace
安装后,核心不是记住每个 skill 名字,而是让 agent 在任务开始前检查是否有适用技能,并按技能要求执行。
局限
Superpowers 的流程很严格。对很小的改动,它可能显得繁琐;对不想 TDD 或不想先写设计的用户,也可能不符合工作习惯。
它也更依赖 agent 对 skill 的遵守程度。如果平台没有很好地支持 skill/plugin,体验会打折。
横向比较
| 维度 | grill-me | Trellis | Superpowers |
|---|---|---|---|
| 核心目标 | 把方案问透 | 把项目规范和任务持久化 | 给 agent 套完整工程方法论 |
| 介入层级 | 单个 skill | 仓库级框架 | 插件/技能体系 |
| 是否改项目结构 | 否 | 是,新增 .trellis/ | 通常不一定,取决于平台和流程 |
| 是否适合团队 | 一般 | 很适合 | 适合,但更偏流程纪律 |
| 是否跨平台 | 取决于 skill 支持 | 官方强调多平台 | 支持多个 agent 平台 |
| 是否强调测试 | 不直接强调 | Verify 阶段运行检查 | 强调 TDD 和验证 |
| 是否保留项目记忆 | 否 | 是,.trellis/workspace/ | 通过流程和文档间接保留 |
| 学习成本 | 低 | 中 | 中到高 |
怎么选
只想把需求问清楚
选 grill-me。
它很适合放在实现前:
先用 grill-me 问我这个设计,直到所有关键分支都明确,再开始写代码。
希望项目长期积累规范
选 Trellis。
如果你经常遇到这些问题,Trellis 更合适:
- agent 不记得项目约定。
- 每次新会话都要重复解释背景。
- 团队成员使用不同 agent。
- 希望规范、PRD、任务状态都能 review。
希望 agent 默认按工程纪律做事
选 Superpowers。
它更像“给 agent 装一套工作习惯”。尤其适合复杂任务、bug 修复、需要 TDD 和验收证据的项目。
组合使用建议
三者不是互斥关系,可以组合:
grill-me
-> 把需求和风险问透
Trellis
-> 把 PRD、规范和任务沉淀进仓库
Superpowers
-> 执行时约束设计、计划、TDD、debug、review、验证
一个实际流程可以是:
- 用 grill-me 压测想法。
- 用 Trellis 把结论写成项目任务和 specs。
- 用 Superpowers 驱动 agent 按工程流程实现。
如果只选一个:
- 个人短任务:grill-me。
- 长期项目或团队:Trellis。
- 高质量实现流程:Superpowers。
小结
grill-me、Trellis 和 Superpowers 解决的是同一条链路上的不同问题。
grill-me 解决“开工前有没有想清楚”;Trellis 解决“项目上下文能不能跨会话、跨人员、跨平台保留下来”;Superpowers 解决“agent 执行时能不能遵守工程纪律”。
对 AI 编程来说,最有价值的不是再多一个提示词,而是把不稳定的会话变成可复用、可审查、可验证的工作流。