简介
本大数据课程较少讲解概念和理念,而是直接围绕“大数据存储、大数据计算、大数据挖掘”三大核心技术实现,以及金融行业落地场景为主要内容提纲展开,请课程学员对大数据背景理论有初步学习了解。本系列课程都是偏实战落地,课程学员需要在课程上做好动手准备。
目标
本大数据课程较少讲解概念和理念,而是直接围绕“大数据存储、大数据计算、大数据挖掘”三大核心技术实现,以及金融行业落地场景为主要内容提纲展开,请课程学员对大数据背景理论有初步学习了解。本系列课程都是偏实战落地,课程学员需要在课程上做好动手准备。
受众人群
大数据爱好者、软件开发工程师、数据库开发人员、数据分析师、网络后台开发人员、运维人员、项目经理和对大数据内容感兴趣并想提升的人员。
课程时长
1天(6H)
分享提纲
数据挖掘和机器学习是属于大数据的核心技术之一,以科学严谨的数据依据帮助企业做分析决策,同时其高深的理论门槛也阻挡了广大工程师的学习上手,在大数据时代,如何进行基于海量数据在成百上千的机器进行分布式数据挖掘更是需要解决的难题,本课程从实战角度出发,基于企业实际需求,深入浅出的讲解数据挖掘最常用的算法和企业场景,让工程师通俗易懂的掌握,并且进行编程落地实践培训,让抽象的算法公式完全落地为工程化的程序为企业所用。详细内容参考课程提纲:
一、大数据分析挖掘技术介绍 | 1、map/reduce 2、mahout数据挖掘 3、sql on hadoop 4、spark生态体系 5、R语言 6、MPI并行计算 7、GPU并行计算(深度学习) 8、java并行计算框架 |
二、常用机器学习算法原理 | 1、互联网金融业务—如何构建阿里金融系统 2、银行客户需求业务 3、大数据分析生产平台 4、推荐/广告系统的原理、架构、模型、验证等。 5、基于GBDT的组合模型架构 |
三、大数据挖掘业务场景和生产平台 | 1、互联网金融业务—如何构建阿里金融系统 2、银行客户需求业务 3、大数据分析生产平台 4、推荐/广告系统的原理、架构、模型、验证等。 5、基于GBDT的组合模型架构 |
四、编程实践(动手) | 1、迭代类机器学习编程入门-求圆周率 2、pagerank的并行化实现(*) 3、逻辑回归算法的java实现 4、决策树c45,id3的java实现 5、随机森林和全树并行化实现 6、训练数据和结果模拟器 7、模型结果规则化处理 8、协同过滤java实现 9、基于图计算的推荐java实现 |
Nathan Mu
百林哲咨询(北京)有限公司专家团队成员
Nathan Mu
百林哲咨询(北京)有限公司专家团队成员
Nathan Mu
百林哲咨询(北京)有限公司专家团队成员
Nathan Mu
百林哲咨询(北京)有限公司专家团队成员
Nathan Mu
百林哲咨询(北京)有限公司专家团队成员