课程简介
多模态大模型教育落地作为当前行业最具挑战也最具价值的场景之一,其技术演进正深刻重塑“教-学-评”全链路。业界当下聚焦于模态对齐、跨模态推理与隐私计算三大硬核方向;随着通用智能体(Agent)的兴起,Training-Free 自适应与边缘-云协同架构正成为突破算力与合规瓶颈的关键。
超长序列同步、多模态RAG 检索与 Agentic AI 的新范式,对教育场景的实时性、准确性及合规性提出系统级挑战。已形成从算法、框架到 Infra 的全栈闭环实践,核心提炼为三大要点:
1. 基于 DeepSpeed 的训练框架:在 DeepSpeed ZeRO-3 与序列并行基础上,自研异构对齐、差分隐私训练插件,显著降低推理和合规成本;
2. 以 Phi 为基座的大模型:在 Phi-3.5-vision 之上引入 Cross-Attention 细粒度对齐与 RAG-Plugin,可在超长图文上下文基础上在特定领域实现高可信度易用;
3. Edu-Copilot Agent:零训练集成 Edu-Copilot 与校内边缘知识库,通过链式 CoT 与多模态工具调用,实现“自动化备课-个性化授课-自动评测”全链路自适应。
本次分享将系统回顾多模态大模型在教育场景下的算法-Infra 协同演进,并深度解析从核心技术攻关到真实课堂规模化落地的全链条最佳实践。
课程收益
1、帮助学员掌握多模态大模型演进中的技术拐点与价值定位,构建技术选型决策框架;
2、帮助学员突破低容错教育场景的多模态理解瓶颈,输出可落地的训练-推理优化方案;
3、帮助学员构建“数据工程-架构迭代-基础设施”端到端闭环能力,驱动教育Agent规模化落地
受众人群
教育技术开发者、算法工程师、教育行业解决方案专家、学校与教育机构管理者,以及其他对多模态大模型赋能教育领域感兴趣的人员
课程周期
0.5天(3H)
课程大纲
1、从“智能批改”到“全链路 AI 助教”的演进:长序列、多模态、合规性
2、典型方案对比::BERT-ViT、BEiT-3、GPT-4V、Phi-3.5-vision、Edu-Copilot 架构
3、大模型算法与训推 Infra 深度拆解(基座,框架,推理)
4、多模态Agent行业落地实践
5、垂直大模型技术趋势与展望
6、QA