课程简介
随着人工智能技术的不断发展,大模型在各个领域的应用日益广泛,随之而来的问题也愈发凸显,如幻觉现象、信息过时、专业领域知识匮乏以及推理能力不足等。这些问题不仅影响了模型的准确性和可靠性,还给企业的实际应用带来了很大的困扰。在此背景下,RAG技术应运而生。它巧妙结合检索与生成的能力,显著提升了模型的准确性和可靠性,确保企业在实际应用中能够获取到准确且有价值的信息,为企业在竞争激烈的市场环境中赢得先机提供了有力支持。
本课程深入解析RAG(检索式增强生成)技术,涵盖RAG技术的范式演进、核心步骤、细节实现及评估方法,同时展望RAG的垂直优化、多模态拓展及生态建设前景,为学员提供全面的RAG技术知识体系与实践指导。
课程收益
1、帮助学员全面掌握RAG技术原理与应用;
2、帮助学员掌握RAG技术的细节实现与优化方法;
3、帮助学员洞察RAG技术的未来发展趋势与前景
受众人群
人工智能与机器学习领域的专业人士、自然语言处理(NLP)工程师、数据分析师、数据科学家及其他对AI和大数据感兴趣的开发者人员
课程周期
1天(6H)
课程大纲
标题 | 授课内容 |
一、RAG概述 | 1. 为什么需要RAG (1) 大模型落地过程中的实际问题 ① 幻觉 ② 过时信息 ③ 缺乏专业领域的知识 ④ 推理能力弱 (2) 生产环境中的实际需求 ① 特定领域的准确回答 ② 数据频繁且实时更新 ③ 生成内容的可追溯性和可解释性 ④ 成本可控 ⑤ 隐私保护(私有化部署) 2. RAG应运而生 (1) 大模型落地过程中的一般优化路径 ① 提示词工程(prompt engineering) ② 检索式增强生成(RAG) ③ 指令微调(Fine-Tuning) (2) RAG 和微调的区分 (3) RAG 的适用场景 ① 知识数据长尾分布 ② 频繁的知识更新 ③ 生成结果需要准确且可追溯 ④ 细分垂类知识密集 ⑤ 需要考虑数据隐私 |
二、RAG技术的范式演进 | 1. 经典的 RAG(Naive RAG) (1) 索引 — 将文档库分割成较短的 Chunk,并通过编码器构建向量索引。 (2) 检索 — 根据问题和 chunks 的相似度检索相关文档片段。 (3) 生成 — 以检索到的上下文为条件,生成问题的回答。 2. 进阶的 RAG(Advanced RAG) 3. 模块化 RAG(Modular RAG) 4. 三种RAG模式的关系 |
三、RAG技术核心步骤 | 1. RAG检索什么? 2. RAG什么时候触发检索? 3. RAG如何使用检索的内容? 4. 当前RAG增强能力发展综述回顾 |
四、RAG技术的细节实现 | 1. 数据准备阶段优化 (1) 数据存储优化 (2) 结构化语料库 (3) 检索源优化 (4) KG作为检索数据源 2. 检索能力优化 (1) 查询优化 (2) 嵌⼊优化 (3) 检索过程优化 3. 混合(RAG + 微调) 4. 相关研究综述文献汇总 |
五:如何评价RAG? | 1. 评估框架 2. 评估流程 |
六、未来RAG的发展前景 | 1. RAG 的垂直优化 2. RAG 的多模态的拓展 3. RAG 的生态 |
Richard Ma
百林哲咨询(北京)有限公司专家团队成员
Richard Ma
百林哲咨询(北京)有限公司专家团队成员
Richard Ma
百林哲咨询(北京)有限公司专家团队成员
Richard Ma
百林哲咨询(北京)有限公司专家团队成员
Richard Ma
百林哲咨询(北京)有限公司专家团队成员
Richard Ma
百林哲咨询(北京)有限公司专家团队成员
Richard Ma
百林哲咨询(北京)有限公司专家团队成员