课程 ID: 18277
描述:
案例背景:
AI辅助编程中,根据需求自动找到相关文件,我们称之为上下文感知,对上下文挑战最大的挑战就是超大项目(比如单单源码就过万,上千万token),auto-coder 在实战中成长,多次面临这些项目的挑战。同时,受限于窗口,如果单个源码文件就大于大模型,而上下文有可能涉及多个文件,对于AI自动修改而言,挑战也是非常大的。auto-coder针对这些问题,分别给了自己的解决方案。
解决思路:
1. 我们采用多级索引机制 以及 搭配 我们自研的 LLM-Native RAG 解决超大项目的问题。
2. 我们通过窗口+大模型抽取 + 多代码块融合技术实现了超大文件的修改
3. 我们通过多种剪枝方法实现了超大上下文的支持。
成果:
我们成功的应用于5000-10000万个java源码的项目中,并且也用于JSP 等项目的改造。同时我们也实现了成功修改超大单文件的能力。