简介
近年来运维技术飞速发展,但如何有效的利用各种自动化运维系统最终实现站点的高可用、高性能、高可扩展,系统之间的联动调度需要有背后的数据支撑。传统意义上的监控系统不足以驱动复杂的运维需求,我们需要基于全量的数据分析处理作出决策。本次主题围绕海量日志实时收集处理和检索分析的平台建设过程,介绍在非结构化处理、关联分析、异常检测、资源管控等多方面的设计探索、算法选择和场景运用。
目标
1、理解数据监控和分析在运维工作的重要性。
2、掌握如何实现一个基于数据驱动的自动化运维体系。
3、了解数据分析及机器学习算法目前在运维领域可行的运用思路。
课程时长
1天(6H)
受众人群
初步完成了配置自动化工作的DevOps们
特点
理论结合实践,大型互联网公司实操演练。
分享提纲
AM | 1、介绍一种以数据驱动为核心的自动化运维体系构建思路。 |
2、介绍数据平台的实践难点和各自的解决方案选择。 | |
PM | 3、针对部分复杂难点,介绍几种机器学习算法的运用和效果。 |