数据挖掘和大数据分析技术培训
Andrew Yin 查看讲师
百林哲咨询(北京)有限公司专家团队成员
资深大数据专家多年从事大数据、云计算研发工作经验,数学博士,IT从业近二十年,擅长OpenStack、Hadoop、HDFS、HBase、Hive、MapReduce、Zookeeper、等大数据技术和开源框架,曾主导过多个私有云建设项目。
浏览:4939次
详情 DETAILS

简介

大数据技术能够将隐藏于海量数据中的信息和知识挖掘出来,为人类的社会经济活动提供依据,从而提高各个领域的运行效率,大大提高整个社会经济的集约化程度。应用大数据技术可支持在单机上进行小规模数据处理,让数据采用抽样方式来减少数据分析规模。

目标

1、大数据技术概述与发展趋势 

2、大数据基本概念与理论基础知识 

3、大数据挖掘与分析技术概述 

4、数据建模方法概述 

5、模型评估理论、方法及指标 

6、主要常用数据挖掘算法解析 

7、数据挖掘为企业管理者制定战略决策提供数据依据; 

8、使学员彻底理解数据挖掘的概念、技术、思维模式; 

9、使学员具备数据收集、文本数据挖掘、信息提取的能力;

课程时长

2天(12H)

受众人群

1、本课程适合于想通过数据化决策制定企业战略的决策者; 

2、适合于经常需要汇报工作的管理者; 

3、对数据分析、数据挖掘算法等感兴趣的人士; 

4、对 R 语言感兴趣的数据分析人士; 

分享提纲

时间主题内容
第一天大数据技术概述(深入理解大数据技术和发展趋势,以及基本概念与理论基础知识)( 90分钟)

1、大数据概念与理论基础

2、大数据生态体系介绍

3、大数据支撑----云计算

4、大数据核心----海量数据

5、大数据灵魂----大数据技术

6、大数据价值----大数据商业思维

7、大数据发展趋势剖析

数据分析概念(介绍数据分析基础知识)90分钟)

1、数据分析的概念

2、数据分析的过程

3、数据分析的统计学基础

4、数据分析的常用统计方法

5、数据分析的常用工具

数据建模方法概述(介绍数据建模的一般

过程,使学员学会在工作中如何使用数据建模分析)90分钟)

1、数据预处理

2、数据描述与探知

3、研究数据关系

4、总结数据模型

5、验证数据模型

6、趋势预测与决策

7、趋势报告

8、案例演示:R语言实现数据描述与探知

数据分析的常用方法(介绍数据分析的常用分析方法)(90分钟)

1、指标对比分析法

2、因素分析法

3、分组分析法

4、时间数列及动态分析法

5、异常分析法

6、指数分析法

7、平衡分析法

8、综合评价分析

9、预测分析

第二天

数据挖掘概述(全面理解大数据挖掘概念与技术)(90分钟)

1、什么是数据挖掘

2、数据挖掘的应用领域

3、模式识别

4、文本挖掘

5、机器学习

6、有监督的学习

7、无监督的学习

8、模型过分拟合和拟合不足

9、数据挖掘模型

10、数据挖掘模型评估

11、数据挖掘目标

12、数据挖掘数据质量

13、数据挖掘的9大定律

14、数据挖掘发展趋势

常用数据挖掘算法剖析(剖析典型的大数据挖掘算法)(90分钟)

1、决策树算法

2、逻辑回归

3、案例演示:R语言实现逻辑回归

4、神经网络

5、深度学习

6、关联规则算法

7、聚类算法

8、贝叶斯算法

9、时间序列算法

10、其他挖掘算法

大数据推荐实战(深入剖析大数据推荐技术以及推荐技术编程,深入挖掘客户需求)(90分钟)

1、个性化推荐的理论依据

2、个性化推荐的价值

3、个性化推荐能达到的目的

4、个性化推荐的原则

5、个性化推荐技术发展史

6、个性化推荐的相关技术

7、基于用户的常用推荐算法

8、基于用户的协同过滤推荐

9、案例剖析:挖掘客户需求大数据推荐案例

模型评估(介绍模型评估理论、方法及指标)(90分钟)

1、查准率

2、查全率

3、训练集

4、测试集

5、训练误差

6、样本误差

7、测试误差

8、可接受性

9、泛化误差估计

10、残差

11、t检验

12、f检验

13、方差分析

14、R方



企业服务热线:400-106-2080
电话:18519192882
投诉建议邮箱:venus@bailinzhe.com
合作邮箱:service@bailinzhe.com
总部地址:
北京市-丰台区-汽车博物馆东路6号3号楼1单元902-B73(园区)
全国客户服务中心:
天津市-南开区-桂苑路15号鑫茂集团鑫茂军民园1号楼A座802-803
公众号
百林哲咨询(北京)有限公司 京ICP备2022035414号-1