大模型预训练和微调实践
Richard Ma 查看讲师
百林哲咨询(北京)有限公司专家团队成员
国内知名的人工智能和大模型算法专家,拥有丰富培训经验
浏览:1793次
详情 DETAILS

课程简介

在当今数字化和智能化的时代,人工智能技术已经渗透到我们生活的方方面面,AI正以前所未有的速度改变着世界。而深度学习作为AI领域的重要分支,其大模型预训练和微调技术更是推动了AI技术的飞速发展,为各行各业带来了革命性的变革。

本课程详细介绍了大模型预训练和微调技术的原理、方法、实践经验和应用场景,帮助学员更好地掌握大模型预训练和微调技术,为企业的AI技术应用提供有力支持

课程收益

1、帮助学员掌握大模型预训练技术及应用;

2、帮助学员掌握大模型微调技术及应用;

3、帮助学员掌握大模型对齐技术及应用

受众人群

IT运维和基础设施团队、技术研发团队、AI项目经理及对AI技术感兴趣的人员

课程周期

  2天(12H) 

课程大纲

标题

授课内容

一、大模型预训练和微调实践

1. 常见大模型介绍与网络结构的统一性

2. 大模型的缩放法则与涌现能力

3. 大模型的基础训练过程(预训练、指令微调、强化学习对齐)

4. 大模型主流预训练框架介绍(Megatron,Deepspeed)

5. 大模型评价体系(数据集与榜单介绍)

二、预训练技术

1. “从零开始预训练”,常见数据集&如何组织训练数据(参考DoReMi进行数据配比)

2. “增量/继续预训练”,数据预处理&如何确定训练数据的格式(FurtherTrain考虑词表优化)

3. 数据处理流水线与数据质量保障

4. 如何在固定算例预算下,选择大模型的参数,和对应的数据规模

三、指令微调技术

1. 指令数据的结构与构造方法(指令丰富性与多样性)

2. 实践中大模型所需的指令数据规模

3. 指令强化-各类模型能力激发的关键

四、大模型对齐技术

 

1. 大模型价值对齐的实际价值(格式服从、安全保障、垂类强化)

2. 基于PPO算法的RLHF技术

3. 基于DPO算法的RLHF技术

4. 其他偏好对齐技术介绍(KTO等)

五、大模型训练实践( 以LLAMA3为例)

1. 基础权重准备与推理部署

2. 微调数据集准备

3. 全参数微调与Lora微调

4. 分布式训练框架及对应资源准备

5. 大模型训练过程中的LOSS稳定性(数据构造与超参数设定)

6. 内容垂类模型微调实践(格式服从案例)

7. 大模型微调工厂的搭建

六、大模型落地实践项目

1. 大规模推理成本优化(量化、vLLM并行推理)

2. 检索强化型大模型应用(RAG)

3. 如何针对线上Case修复模型问题

4. 如何利用CoT与Agent机制提升模型效果

5. 大模型安全与大模型备案


企业服务热线:400-106-2080
电话:18519192882
投诉建议邮箱:venus@bailinzhe.com
合作邮箱:service@bailinzhe.com
总部地址:
北京市-丰台区-汽车博物馆东路6号3号楼1单元902-B73(园区)
全国客户服务中心:
天津市-南开区-桂苑路15号鑫茂集团鑫茂军民园1号楼A座802-803
公众号
百林哲咨询(北京)有限公司 京ICP备2022035414号-1