RAG技术深度解析与实战应用

Richard Ma 查看讲师

百林哲咨询（北京）有限公司专家团队成员

国内知名的人工智能和大模型算法专家，拥有丰富培训经验

浏览：1458次

详情 DETAILS

课程简介

随着人工智能技术的不断发展，大模型在各个领域的应用日益广泛，随之而来的问题也愈发凸显，如幻觉现象、信息过时、专业领域知识匮乏以及推理能力不足等。这些问题不仅影响了模型的准确性和可靠性，还给企业的实际应用带来了很大的困扰。在此背景下，RAG技术应运而生。它巧妙结合检索与生成的能力，显著提升了模型的准确性和可靠性，确保企业在实际应用中能够获取到准确且有价值的信息，为企业在竞争激烈的市场环境中赢得先机提供了有力支持。

本课程深入解析RAG（检索式增强生成）技术，涵盖RAG技术的范式演进、核心步骤、细节实现及评估方法，同时展望RAG的垂直优化、多模态拓展及生态建设前景，为学员提供全面的RAG技术知识体系与实践指导。

课程收益

1、帮助学员全面掌握RAG技术原理与应用；

2、帮助学员掌握RAG技术的细节实现与优化方法；

3、帮助学员洞察RAG技术的未来发展趋势与前景

受众人群

人工智能与机器学习领域的专业人士、自然语言处理（NLP）工程师、数据分析师、数据科学家及其他对AI和大数据感兴趣的开发者人员

课程周期

1天（6H）

课程大纲

标题	授课内容
一、RAG概述	1. 为什么需要RAG (1) 大模型落地过程中的实际问题 ① 幻觉 ② 过时信息 ③ 缺乏专业领域的知识 ④ 推理能力弱 (2) 生产环境中的实际需求 ① 特定领域的准确回答 ② 数据频繁且实时更新 ③ 生成内容的可追溯性和可解释性 ④ 成本可控 ⑤ 隐私保护（私有化部署） 2. RAG应运而生 (1) 大模型落地过程中的一般优化路径 ① 提示词工程（prompt engineering） ② 检索式增强生成（RAG） ③ 指令微调（Fine-Tuning） (2) RAG 和微调的区分 (3) RAG 的适用场景 ① 知识数据长尾分布 ② 频繁的知识更新 ③ 生成结果需要准确且可追溯 ④ 细分垂类知识密集 ⑤ 需要考虑数据隐私
二、RAG技术的范式演进	1. 经典的 RAG（Naive RAG） (1) 索引 — 将文档库分割成较短的 Chunk，并通过编码器构建向量索引。 (2) 检索 — 根据问题和 chunks 的相似度检索相关文档片段。 (3) 生成 — 以检索到的上下文为条件，生成问题的回答。 2. 进阶的 RAG（Advanced RAG） 3. 模块化 RAG（Modular RAG） 4. 三种RAG模式的关系
三、RAG技术核心步骤	1. RAG检索什么？ 2. RAG什么时候触发检索？ 3. RAG如何使用检索的内容？ 4. 当前RAG增强能力发展综述回顾
四、RAG技术的细节实现	1. 数据准备阶段优化 (1) 数据存储优化 (2) 结构化语料库 (3) 检索源优化 (4) KG作为检索数据源 2. 检索能力优化 (1) 查询优化 (2) 嵌⼊优化 (3) 检索过程优化 3. 混合（RAG + 微调） 4. 相关研究综述文献汇总
五：如何评价RAG？	1. 评估框架 2. 评估流程
六、未来RAG的发展前景	1. RAG 的垂直优化 2. RAG 的多模态的拓展 3. RAG 的生态