30 万实体 × 千次 LLM × Harness 护栏 — MemoryBank 企业落地与原子化渐进开源

课程 ID: 19347

描述:
话题概述: opc 内部研发体系覆盖 14 个跨端代码仓库 —— 532 子项目的前端 monorepo、Android、iOS、Flutter、Java/Python/Go 多个后端服务、小程序运行时、跨端框架、通用基础库(common-libs),加上 1 万+业务文档(Confluence / Jira / googledoc)。 工程师在这种规模下面对的真实痛点: - 跨端业务排查链路长:一个“小程序白屏”问题同时横跨 Android 运行时、iOS 等价模块、mono 业务页面、SDK 框架 4-5 条链路,平均定位 1-2 小时 - 商业 RAG 工具不顶用:Cursor / Continue 的 function-chunk 切分对前端“文件即组件”的语义结构完全失效,候选池里 95% 是 boilerplate;且无法承载团队私有领域知识 - AI Agent 桌面端的真实瓶颈是“工具调用质量”:multi-agent 编排、kanban 任务拆解、macpilot 自动化操作 — 任何一个 Agent 工具调用拿不到正确代码上下文,整条链路就会幻觉化 - AI 工具链的失败是 silent 而非 hard:搜索质量回归、依赖图损坏、workspace 重建失败、Agent 工具调用 60s 超时被反向代理截断、Mac 睡眠cron 漏起 —— 工具自己不会告诉你今天的索引已经腐烂,往往一周后才被业务侧反馈触发回查 演讲题纲: 话题亮点: 1. MemoryBank CLI 架构演进三阶段:v0.1 (Qdrant + Nebula + Redis 三库协调) → v0.3 (全 Spanner 单后端) → v0.9 (Workspace 抽象 + AI Rerank +skill.md 领域先验)。最终:单后端承载实体表 + entity_dependencies 边表 + COSINE_DISTANCE 向量检索,单查询 P50 5.8s 2. 三层混合检索:text-embedding-3-small 向量召回 + Spanner 原生 BM25 + RRF 融合 + 2 跳依赖图遍历 + Claude Opus 4.7 智能重排序(失败回退 GPT-5.5) 3. AI Enrichment Pipeline:每个 file entity 由 Opus 4.7 生成 action_summary(动宾“做什么”句)、tags、project_desc,embed metadata 而非原始代码 —— 业务流程查询召回稳定性比商业 RAG 高一个量级 4. Workspace 抽象:把“业务边界”从“仓库边界”解耦。Mini-Program Platform 业务跨 7 个仓库 30+ 子目录,通过 fork_to_workspace 用 workspace_id 标签复用底层实体(不复制数据),跨仓库 Louvain 社区聚类自动发现业务模块 5. skill.md 领域先验注入:噪声过滤规则 + Canary 信号清单 + 问题 pattern 库 + Repo×Layer 映射,长日志/跨端 query 自动注入 LLM rerank prompt 6. Concept-Cap 多样性约束:post-AI-rerank 强制 wiki_entity / concept 在 top-K ≤ 3 7. MemoryBank CLi(生产端)Harness 的端到端守护: - Golden Benchmark:20 个 curated query → ground-truth 路径,每日跑 Recall@k / NDCG@k / MRR,回归阈值告警 - Real Benchmark:14 repo × 4 query 的真实搜索延迟 p50/p95 - Sanity Gate(端到端 6 项):workspace rebuild ≥6/6、golden NDCG ≥ 0.10、phase2 失败率 ≤ 25%、build-deps 完整结束、GT-drift 验证、Mac 睡眠拦截 - GT-Drift 监控:每日跑 verify-gt-drift.mjs,扫描 golden GT 路径在 entities 表是否存在,漂移即非零退出 9. Redis Cluster 多重命脉:AWS ElastiCache 同时承担 — workspace skill 热缓存、LiteLLM rerank 流量审计、search-monitor 实时指标流、跨进程日志聚合、Redis Cluster MOVED/ASK 重定向自适应;月级千万次 Redis 操作