课程 ID: 16977
描述:
案例背景:
特赛发LLM大语言模型落地实战分享:
1、为什么全栈自研垂类大模型
2、自研LLM需要哪些资源
3、LLM落地的基本范式
4、预训练模型实战
5、RLHF内核情景分析
6、COT的数学本质
解决思路:
1、构建了一个可以快速训练中等预训练模型的GPU训练套件
2、构建了预训练的数据,并对模型结构进行了优化
3、RLHF解决闲聊问题
4、具有COT推理能力
成果:
最终100%交付成功。达到预期效果。对于大语言模型落地真实业务场景有了真实体验。