# YxStack 路线图 ## v0.0.1 — 核心框架(已完成) - [x] 核心哲学与定位 - [x] 8 条命令执行模板(Checklist + 输出结构 + 常见误区) - [x] 全局 CODEBUDDY.md 集成机制 ## v0.1.2 — 自动升级(已完成) - [x] Agent 会话启动时自动检查远端版本号 - [x] 发现新版本主动提醒用户升级 - [x] `VERSION` 文件 + git tag 双重版本标记 - [x] install.sh 兼做安装和升级 ## v0.1.1 — 一键安装(已完成) - [x] `install.sh` 安装脚本,一行命令完成全部配置 - [x] README 简化为一行安装指令 - [x] 智能检测:已有配置跳过、新用户自动创建 CODEBUDDY.md ## v0.1.0 — 知识沉淀机制 ### 项目级痕迹库(已实现) - [x] 每条指令执行完毕自动存档到 `{项目根目录}/.yxstack/` - [x] 统一格式:YAML frontmatter + 报告正文 - [x] 文件命名:`{指令}-{日期}-{摘要}.md` ### 跨项目隔离(已实现) - [x] 不同项目的 yxstack 历史互不串读 - [x] 执行指令时模型只读取当前项目的 yxstack/ 目录 ### 回溯与进化(已实现) - [x] 每条指令新增「第 0 步:回溯历史」——执行前先读同项目同类历史记录 - [x] 每条指令新增「存档规则」——执行完按规范存档 - [x] 报告标注与历史结论的一致性/矛盾/更新 ### 待完成(→ 下移到 v0.2.1) - [ ] 知识冲突自动检测——新结论与历史矛盾时主动提醒 - [ ] 指令执行时自动识别项目边界,找到对应 yxstack/ 目录 ## v0.2.0 — 多轮对话状态保持(已完成) - [x] 跨会话上下文记忆——今天跑了 `/prd`,三天后跑 `/money` 时能回溯 PRD 的假设 - [x] 对话产出递进检测——同项目多轮对话之间,产出应递进而非重复 - [x] 项目级全局状态文件——`{项目根目录}/.yxstack/_state.md`,记录当前阶段、关键假设、决策链 - [x] 会话开始时自动读取 `_state.md`,结束会话前自动更新 - [x] 状态过期/矛盾标注——假设发生变化时,标记旧假设为 outdated 并记录变化原因 ## v0.2.1 — 漏洞修补 ← 当前 借鉴 gstack(YC CEO Garry Tan 开源的 AI 工程团队工作流)的设计模式,补齐遗留项。 - [ ] **Confusion Protocol** — 8 条命令统一引入假设暴露机制:关键事实缺证据时停止推理,转为追问 - [ ] **假设验证路径** — 每个 active 假设必须附带可证伪的验证标准 - [ ] **假设上限** — 同时 active 假设 ≤ 5 条,超过必须先标记旧假设为 outdated - [ ] **项目边界显式声明** — CWD 即 YxStack 项目根,不搜索父目录(对标 gstack CWD + /freeze 模式) - [ ] **前置摘要恢复** — pos.md 回溯 pfit 结论,uj.md 回溯 pfit + pos 结论(对标 gstack /context-restore 的 Summary + Remaining 结构) - [ ] ROADMAP 同步 — v0.2.0 标记完成,v0.1.0 遗留项下移 ## v0.3.0 — 指令深度增强(原 v0.2.0) - [ ] 为每条命令增加典型场景案例库 - [ ] 细化各阶段追问权重与优先级 - [ ] 增加"未完待续"处理策略(信息不足时怎么收口) ## v0.4.0 — 命令组合模式(原 v0.3.0) - [ ] `/prd + /pfit` = 完整产品评审流程 - [ ] `/pos + /comp` = 市场定位全景分析 - [ ] `/uj + /metric` = 用户体验指标体系 - [ ] 组合命令的输出融合规范 ## v0.5.0 — 场景自动识别(原 v0.4.0) - [ ] 模型无需用户显式使用 `/xxx`,自动识别当前场景 - [ ] 自动匹配最相关的 1-2 条指令 - [ ] 渐进式引导——先判断在哪个阶段,再切入对应清单 ## v0.6.0 — 扩展生态(原 v0.5.0) - [ ] 支持行业定制模板(SaaS、电商、医疗、教育等) - [ ] 集成到 Hookify 体系——通过 prompt 钩子自动匹配场景 - [ ] 社区贡献机制——开放命令模板 Pull Request 流程 ## v1.0.0 — 完整评测体系 - [ ] 一致性评测——同一场景多轮输出是否自洽 - [ ] 准确性评测——标准场景下输出是否命中关键点 - [ ] 覆盖度评测——每条命令的 Checklist 是否覆盖边界情况 - [ ] 评测集构建——10-20 个标准场景 + 期望输出标准 - [ ] 发版前自动评测流程 --- > 维护:筑基阁(开阳星)