课程简介
在当今数字化和智能化的时代,人工智能技术已经渗透到我们生活的方方面面,AI正以前所未有的速度改变着世界。而深度学习作为AI领域的重要分支,其大模型预训练和微调技术更是推动了AI技术的飞速发展,为各行各业带来了革命性的变革。
本课程详细介绍了大模型预训练和微调技术的原理、方法、实践经验和应用场景,帮助学员更好地掌握大模型预训练和微调技术,为企业的AI技术应用提供有力支持。
课程收益
1、帮助学员掌握大模型预训练技术及应用;
2、帮助学员掌握大模型微调技术及应用;
3、帮助学员掌握大模型对齐技术及应用
受众人群
IT运维和基础设施团队、技术研发团队、AI项目经理及对AI技术感兴趣的人员
课程周期
2天(12H)
课程大纲
标题 | 授课内容 |
一、大模型预训练和微调实践 | 1. 常见大模型介绍与网络结构的统一性 2. 大模型的缩放法则与涌现能力 3. 大模型的基础训练过程(预训练、指令微调、强化学习对齐) 4. 大模型主流预训练框架介绍(Megatron,Deepspeed) 5. 大模型评价体系(数据集与榜单介绍) |
二、预训练技术 | 1. “从零开始预训练”,常见数据集&如何组织训练数据(参考DoReMi进行数据配比) 2. “增量/继续预训练”,数据预处理&如何确定训练数据的格式(FurtherTrain考虑词表优化) 3. 数据处理流水线与数据质量保障 4. 如何在固定算例预算下,选择大模型的参数,和对应的数据规模 |
三、指令微调技术 | 1. 指令数据的结构与构造方法(指令丰富性与多样性) 2. 实践中大模型所需的指令数据规模 3. 指令强化-各类模型能力激发的关键 |
四、大模型对齐技术
| 1. 大模型价值对齐的实际价值(格式服从、安全保障、垂类强化) 2. 基于PPO算法的RLHF技术 3. 基于DPO算法的RLHF技术 4. 其他偏好对齐技术介绍(KTO等) |
五、大模型训练实践( 以LLAMA3为例) | 1. 基础权重准备与推理部署 2. 微调数据集准备 3. 全参数微调与Lora微调 4. 分布式训练框架及对应资源准备 5. 大模型训练过程中的LOSS稳定性(数据构造与超参数设定) 6. 内容垂类模型微调实践(格式服从案例) 7. 大模型微调工厂的搭建 |
六、大模型落地实践项目 | 1. 大规模推理成本优化(量化、vLLM并行推理) 2. 检索强化型大模型应用(RAG) 3. 如何针对线上Case修复模型问题 4. 如何利用CoT与Agent机制提升模型效果 5. 大模型安全与大模型备案 |
Richard Ma
百林哲咨询(北京)有限公司专家团队成员
Richard Ma
百林哲咨询(北京)有限公司专家团队成员
Richard Ma
百林哲咨询(北京)有限公司专家团队成员
Richard Ma
百林哲咨询(北京)有限公司专家团队成员
Richard Ma
百林哲咨询(北京)有限公司专家团队成员
Richard Ma
百林哲咨询(北京)有限公司专家团队成员
Richard Ma
百林哲咨询(北京)有限公司专家团队成员