从辅助到协作,再到自主
Mint研发-刘迪行
演变历程
从 Tab 补齐到 Agent 破圈
工具与模型
选择合适的组合
AI 提效实践
用案例说话
沉淀与系统化
构建你的 AI 工具链
质量把控
人的角色与最佳实践
五个阶段,从单行补全到 Agent 自主执行
人的角色:写代码 → 指挥 AI 写代码 → 设定目标让 AI 自主完成
驱动方式:Prompt → Context → Harness
代表工具
GitHub Copilot
协作模式
人写代码,AI 猜下一行
代表工具
Cursor
协作模式
AI Chat 嵌入 IDE,生成完整函数、参与方案讨论
关键变化
MCP 协议诞生
全称
Model Context Protocol
协作模式
人与 AI 协作,AI能处理更多
让 AI 能安全地连接 Figma、数据库等外部工具和数据源,能力边界大幅拓展
AI 开始能做什么?
• 处理完整的小需求
• 参与复杂需求的方案设计
• 连接外部工具获取上下文
• 理解跨系统的业务逻辑
但此时的问题是
没有好的工作流约束,产出质量不可控
关键变化
Skill 体系诞生
模型跃升
Opus 4.5 / GPT-5.3 / Gemini 3 Pro
上下文
200K → 1M tokens
协作模式
人指挥,AI 独立执行全流程
Skill 体系
Skill 概念的提出,把工作流标准化、可复用,AI 有了武功秘籍
Vibe Coding 成为现实
通过 Rules + workflow + Skills,能独立完成从开发到提测的全流程
角色转变
开发者从"写代码的人"转变为"指挥 AI 写代码的人"
关键变化
Harness 概念、Agent能力进化 + 模型再跃升
模型
Opus 4.6 / GPT-5.4 / Gemini 3.1 Pro
协作模式
人设定目标,Agent 自主执行
AI 不再是程序员的专属工具,而是人人可用的数字助手。
模型能力跃升
推理与代码能力再上台阶,上下文窗口持续扩大
Harness 系统化
Agent 操作框架成熟,可自主完成复杂任务
数字员工
AI Agent 从开发工具进化为可独立工作的角色
没有最好的工具,只有最合适的工具
CLI / Agent
Claude Code
Codex CLI
Gemini CLI
OpenClaw
...
可自主执行复杂任务的Agent
IDE 集成
Cursor
Codex 插件
Windsurf / Antigravity
Taro
...
编辑器集成,交互式开发
Model
Claude Opus 4.6
GPT-5.4
Gemini 3.1 Pro
GLM/KiMi
...
不同模型各有长板
根据使用场景、任务复杂度合理搭配模型
$$$
重型模型
Claude Opus 4.6 / GPT-5.4
复杂架构 · 疑难 Bug · 安全审计
$$
主力模型
Claude Sonnet 4.6 / GPT-5.3-codex ...
日常开发 · 代码生成 · PR 审查
$
轻量模型
GPT-4o mini / Haiku / Gemini Flash
简单编辑 · 文件查找 · 格式化
有了工具和模型之后
从几个实战案例来看
用案例说话 — Rules、Skill(工作流)、Memory 如何落地
用 Cursor 将 三年的H5 复杂项目完全重构为 Next.js
产出比:人:AI 3:7
结果:前期提效,后期 Bug 超多,总耗时反而增加。
• Rules 不完整,前期只定义了一些简单的rules
• 任务粒度太粗,缺乏阶段性验证
• 缺乏工作流约束,没有统一完善的重构规则
完善 Rules, PC 端开发时全面改进方法
产出比:人:AI 2:8
结果:提前提测、质量较高,Bug 显著减少
• 强化编码 Rules
• 细分任务粒度,逐页面推进
• 定义H5-PC页面完整工作流
AI 能力再强,没有好的工作流和规则约束,产出质量依然不可控。
全新项目,从架构设计、到编码、提测、bug修复到上线,全程零手工编程
Rules 约束
代码风格、组件规范、状态管理规则全部预设
Skill 驱动(内含完整工作流)
需求分析 → 技术设计 → 编码 → 测试 → 交付,一条命令触发
0
行手工代码
开发者角色:从"写代码"
转变为"指挥 AI 写代码"
关键步骤
1. 让 AI 熟悉已有项目 — 建立项目文档 2. 按照工作流开发 3. 搭配 Skill 自动修复 Bug
INPUT
Figma URL
设计图 URL
接口文档 (YAML)
WORKFLOW
需求分析 → 技术设计 → 实施计划 → 编码开发 → 测试验证 → 变更记录
OUTPUT
prd.md · design.md
plan.md
code
test.md · changelog
01
Rules
把项目的编码规范、架构约束显性化,让 AI 自动遵守
02
Skill
将工作流(Workflow)+ Rules 封装为一条命令,可复用、一键触发
03
Memory
建立项目记忆库,让 AI 理解项目上下文、架构和历史决策
这些都可以沉淀下来,变成团队的 AI 资产 →
把经验封装为可复用的 AI 工具链
写代码
搭 Agent
以前端为例,从需求交付到问题修复,覆盖完整开发生命周期
/ik:fe-demand
需求澄清 → 技术方案 → 编码实现 → UI 验证 → 交付报告
全流程闭环 · 跨平台可用
/ik:fe-fix-bug
Jira 读取 Bug → 前后端判断 → 定位代码 → 最小修复 → 中文报告
自动连接 Jira API
/ik:fe-fix-ui
读取 Wiki UI走查问题 → 读取设计稿 → 精确修复 → 记录
自动连接 Confluence API
后端、客户端同步沉淀中 — 各端就绪后实现多 Agent 协同,提需求即全端自动交付
Skill 全景 — 支持 Claude Code / Codex / Cursor / OpenClaw 四平台
/ik:fe-fix-bug
Jira 读取 Bug → 前后端判断 → 定位代码 → 最小修复 → 中文报告
/ik:fe-fix-ui
读取 Wiki UI 走查问题 → 读取设计稿 → 精确修复 → 记录
Rules + Skills + Hooks + MCP + Agents + Evals + Memory = Harness
⚙
Rules
编码规范
⚡
Skills
可复用工作流
⚓
Hooks
自动化检查
☍
MCP
外部工具连接
★
Agents
子任务执行者
☑
Evals
质量度量
📚
Memory
经验持久化
隐性知识 →
AI 可执行的规则和流程
AI 写代码,人把关质量
Harness 控制 AI 产出的下限,但作为技术人员,你还需要:
01
深入理解需求
你不写代码,但你必须比 AI 更懂需求。只有这样才能发现 AI 遗漏或误解的地方。
02
关键节点审核
技术方案、实施计划、核心代码实现 — 每个阶段都要审核。不要等到代码写完才发现方向错了。
03
最终验收
功能正确性 · 用户体验 · 代码规范 · 性能 · 安全 — 系统性验收。
完善的 Rules + Skill 能控制 AI 的下限,但面对长上下文复杂任务,仍可能出现”幻觉”、功能遗漏、技术偏移。
单模型 · 多角度自检
同一个模型从不同角度审计方案:
架构合理性 · 安全风险 · 性能瓶颈 · 代码规范
适用于:技术方案设计、Plan 制定阶段
多模型 · 交叉 Review
不同高级模型进行多轮互相 Review,进一步降低犯错可能:
Claude Opus ↔ GPT-5.4 ↔ Gemini Ultra
适用于:成果验收、关键代码审查阶段
提速:并行多 Agent
复杂任务拆分为互相独立的子任务,同时启动多个 Agent 并行提速
减少bug:TDD 测试驱动
写测试 (RED) → AI 实现 (GREEN) → 重构 (IMPROVE) → 覆盖率 ≥ 80%
降本:模型分层路由
不同阶段、不同任务用不同模型,降低Token成本
Agent 安全
敏感操作人工确认 · Agent 环境沙箱隔离 · 核心私钥加密,避免出现在对话中
多用优秀的 Skill
everything-claude-code · superpower 等开源 Skill 生态
01
多用、多探索
了解 AI 的能力边界,知道什么场景用什么工具
02
沉淀工具链
把重复流程封装为 Skill,让经验可复用
03
质量把控
越是 AI 写代码,越需要人来把关
Q & A