课程简介
在数据基建中注重数据与模型的紧密结合,根据模型的需求进行数据的预处理、特征工程等操作,会使数据更好地适配模型训练和推理,提高AI应用的性能和效果。服务化的数据基建有着预先构建好的组件和功能模块,便于搭建数据处理和存储的基础架构,可快速获取所需的数据资源并开展应用开发,大大缩短了项目的开发周期,使AI应用能够更快地进入市场。同时,将复杂的数据操作封装成服务,简单API调用,降低开发的技术门槛和难度,使开发者能够更专注于业务逻辑和AI模型的开发,提高了整体开发效率。
AI原生应用演进呈现两阶段特征:初期通过实时多租户服务获取海量用户,对数据库的并发、隔离、成本提出挑战 ;成熟期则利用积累的海量向量数据训练模型、构筑壁垒,需要PB级数据处理能力,都大大超出了传统向量数据库的设计范畴。Zilliz视其为连续的“数据基建服务化”过程 。Milvus正在演进为同时支持从大规模多租户的在线计算引擎,也能够作为向量数据湖助力产品迭代,以统一架构支撑AI应用全生命周期。
本次分享将剖析Milvus通过云原生架构、创新的多租户解决方案及向量数据湖技术为AI应用提供服务化、可演进的数据基础设施。让企业获得践行落地的多租户方案设计模式与性能调优方法实践。
课程收益
1、通过向量数据库的演进,帮助学员了解AI应用全生命周期的“数据基建服务化”。
2、帮助学员了解向量数据库作为未来AI技术栈核心支柱的演进趋势。
3、3、通过架构优化大幅提升系统稳定性与效率,帮助学员了解支撑大规模实时计算服务的关键架构设计与工程实践。
4、帮助学员了解从在线计算到离线查询的数据服务化场景
受众人群
AI原生应用开发者、数据架构师、AI基础设施运维人员、多模态数据处理工程师、AI产品经理及业务决策者,以及其他对向量数据库感兴趣的人员
课程周期
0.5天(3H)
课程大纲
1、向量数据库简介
2、AI原生场景的数据服务化生命周期:从在线到离线
3、多租在线计算场景带来的挑战
4、向量湖应对海量模型训练数据
5、复杂的搜索方式和DataModel解决多模态难题
6、QA