借鉴 gstack 设计模式: - 8 条命令统一引入 Confusion Protocol(关键事实缺证据停止推理) - 假设验证路径 + 假设上限(≤5 条 active) - CWD 显式项目边界声明 - pos/uj 前置指令摘要(对标 gstack /context-restore) - ROADMAP 同步 + state_template 增强 - CHANGELOG v0.2.1
4.2 KiB
4.2 KiB
YxStack 路线图
v0.0.1 — 核心框架(已完成)
- 核心哲学与定位
- 8 条命令执行模板(Checklist + 输出结构 + 常见误区)
- 全局 CODEBUDDY.md 集成机制
v0.1.2 — 自动升级(已完成)
- Agent 会话启动时自动检查远端版本号
- 发现新版本主动提醒用户升级
VERSION文件 + git tag 双重版本标记- install.sh 兼做安装和升级
v0.1.1 — 一键安装(已完成)
install.sh安装脚本,一行命令完成全部配置- README 简化为一行安装指令
- 智能检测:已有配置跳过、新用户自动创建 CODEBUDDY.md
v0.1.0 — 知识沉淀机制
项目级痕迹库(已实现)
- 每条指令执行完毕自动存档到
{项目根目录}/.yxstack/ - 统一格式:YAML frontmatter + 报告正文
- 文件命名:
{指令}-{日期}-{摘要}.md
跨项目隔离(已实现)
- 不同项目的 yxstack 历史互不串读
- 执行指令时模型只读取当前项目的 yxstack/ 目录
回溯与进化(已实现)
- 每条指令新增「第 0 步:回溯历史」——执行前先读同项目同类历史记录
- 每条指令新增「存档规则」——执行完按规范存档
- 报告标注与历史结论的一致性/矛盾/更新
待完成(→ 下移到 v0.2.1)
- 知识冲突自动检测——新结论与历史矛盾时主动提醒
- 指令执行时自动识别项目边界,找到对应 yxstack/ 目录
v0.2.0 — 多轮对话状态保持(已完成)
- 跨会话上下文记忆——今天跑了
/prd,三天后跑/money时能回溯 PRD 的假设 - 对话产出递进检测——同项目多轮对话之间,产出应递进而非重复
- 项目级全局状态文件——
{项目根目录}/.yxstack/_state.md,记录当前阶段、关键假设、决策链 - 会话开始时自动读取
_state.md,结束会话前自动更新 - 状态过期/矛盾标注——假设发生变化时,标记旧假设为 outdated 并记录变化原因
v0.2.1 — 漏洞修补 ← 当前
借鉴 gstack(YC CEO Garry Tan 开源的 AI 工程团队工作流)的设计模式,补齐遗留项。
- Confusion Protocol — 8 条命令统一引入假设暴露机制:关键事实缺证据时停止推理,转为追问
- 假设验证路径 — 每个 active 假设必须附带可证伪的验证标准
- 假设上限 — 同时 active 假设 ≤ 5 条,超过必须先标记旧假设为 outdated
- 项目边界显式声明 — CWD 即 YxStack 项目根,不搜索父目录(对标 gstack CWD + /freeze 模式)
- 前置摘要恢复 — pos.md 回溯 pfit 结论,uj.md 回溯 pfit + pos 结论(对标 gstack /context-restore 的 Summary + Remaining 结构)
- ROADMAP 同步 — v0.2.0 标记完成,v0.1.0 遗留项下移
v0.3.0 — 指令深度增强(原 v0.2.0)
- 为每条命令增加典型场景案例库
- 细化各阶段追问权重与优先级
- 增加"未完待续"处理策略(信息不足时怎么收口)
v0.4.0 — 命令组合模式(原 v0.3.0)
/prd + /pfit= 完整产品评审流程/pos + /comp= 市场定位全景分析/uj + /metric= 用户体验指标体系- 组合命令的输出融合规范
v0.5.0 — 场景自动识别(原 v0.4.0)
- 模型无需用户显式使用
/xxx,自动识别当前场景 - 自动匹配最相关的 1-2 条指令
- 渐进式引导——先判断在哪个阶段,再切入对应清单
v0.6.0 — 扩展生态(原 v0.5.0)
- 支持行业定制模板(SaaS、电商、医疗、教育等)
- 集成到 Hookify 体系——通过 prompt 钩子自动匹配场景
- 社区贡献机制——开放命令模板 Pull Request 流程
v1.0.0 — 完整评测体系
- 一致性评测——同一场景多轮输出是否自洽
- 准确性评测——标准场景下输出是否命中关键点
- 覆盖度评测——每条命令的 Checklist 是否覆盖边界情况
- 评测集构建——10-20 个标准场景 + 期望输出标准
- 发版前自动评测流程
维护:筑基阁(开阳星)