30 万实体 × 千次 LLM × Harness 护栏 — MemoryBank 企业落地与原子化渐进开源

课程 ID: 19347

描述:
话题概述: opc 内部研发体系覆盖 14 个跨端代码仓库 —— 532 子项目的前端 monorepo、Android、iOS、Flutter、Java/Python/Go 多个后端服务、小程序运行时、跨端框架、通用基础库（common-libs），加上 1 万+业务文档（Confluence / Jira / googledoc）。工程师在这种规模下面对的真实痛点： - 跨端业务排查链路长：一个“小程序白屏”问题同时横跨 Android 运行时、iOS 等价模块、mono 业务页面、SDK 框架 4-5 条链路，平均定位 1-2 小时 - 商业 RAG 工具不顶用：Cursor / Continue 的 function-chunk 切分对前端“文件即组件”的语义结构完全失效，候选池里 95% 是 boilerplate；且无法承载团队私有领域知识 - AI Agent 桌面端的真实瓶颈是“工具调用质量”：multi-agent 编排、kanban 任务拆解、macpilot 自动化操作 — 任何一个 Agent 工具调用拿不到正确代码上下文，整条链路就会幻觉化 - AI 工具链的失败是 silent 而非 hard：搜索质量回归、依赖图损坏、workspace 重建失败、Agent 工具调用 60s 超时被反向代理截断、Mac 睡眠cron 漏起 —— 工具自己不会告诉你今天的索引已经腐烂，往往一周后才被业务侧反馈触发回查演讲题纲: 话题亮点： 1. MemoryBank CLI 架构演进三阶段：v0.1 (Qdrant + Nebula + Redis 三库协调) → v0.3 (全 Spanner 单后端) → v0.9 (Workspace 抽象 + AI Rerank +skill.md 领域先验)。最终：单后端承载实体表 + entity_dependencies 边表 + COSINE_DISTANCE 向量检索，单查询 P50 5.8s 2. 三层混合检索：text-embedding-3-small 向量召回 + Spanner 原生 BM25 + RRF 融合 + 2 跳依赖图遍历 + Claude Opus 4.7 智能重排序（失败回退 GPT-5.5） 3. AI Enrichment Pipeline：每个 file entity 由 Opus 4.7 生成 action_summary（动宾“做什么”句）、tags、project_desc，embed metadata 而非原始代码 —— 业务流程查询召回稳定性比商业 RAG 高一个量级 4. Workspace 抽象：把“业务边界”从“仓库边界”解耦。Mini-Program Platform 业务跨 7 个仓库 30+ 子目录，通过 fork_to_workspace 用 workspace_id 标签复用底层实体（不复制数据），跨仓库 Louvain 社区聚类自动发现业务模块 5. skill.md 领域先验注入：噪声过滤规则 + Canary 信号清单 + 问题 pattern 库 + Repo×Layer 映射，长日志/跨端 query 自动注入 LLM rerank prompt 6. Concept-Cap 多样性约束：post-AI-rerank 强制 wiki_entity / concept 在 top-K ≤ 3 7. MemoryBank CLi（生产端）Harness 的端到端守护： - Golden Benchmark：20 个 curated query → ground-truth 路径，每日跑 Recall@k / NDCG@k / MRR，回归阈值告警 - Real Benchmark：14 repo × 4 query 的真实搜索延迟 p50/p95 - Sanity Gate（端到端 6 项）：workspace rebuild ≥6/6、golden NDCG ≥ 0.10、phase2 失败率 ≤ 25%、build-deps 完整结束、GT-drift 验证、Mac 睡眠拦截 - GT-Drift 监控：每日跑 verify-gt-drift.mjs，扫描 golden GT 路径在 entities 表是否存在，漂移即非零退出 9. Redis Cluster 多重命脉：AWS ElastiCache 同时承担 — workspace skill 热缓存、LiteLLM rerank 流量审计、search-monitor 实时指标流、跨进程日志聚合、Redis Cluster MOVED/ASK 重定向自适应；月级千万次 Redis 操作