数据治理、数据中台与大数据案例分析和最佳实践
Mac Fan 查看讲师
百林哲咨询(北京)有限公司专家团队成员
现任某信息有限公司高级系统架构师,资深技术专家。从事软件研发工作近二十年,并且现在一直坚守在大型软件架构设计一线工作,尤其熟悉互联网架构与分析的特点,长期关注软件代码质量。
浏览:354次
详情 DETAILS

课程简介

中国的IT产业经历了十多年的发展,已经获得了长足的进步。特别是近几年互联网的发展,让中国的IT产业迈向了世界先进行列。然而,未来的IT产业应当何去何从,新的增长点又在哪里呢?那就是数字产业、机器学习、人工智能。但当我们真正要开展这类业务时,却惊奇地发现,没有数据中台,我们什么都干不了。

2018年,阿里提出的“数据中台”概念后,各大厂商纷纷效仿,中国的IT产业开始向DT时代转型。然而,什么是数据中台?它与以往的BI商业智能系统、大数据平台与数据仓库有什么不同?与数据中台建设相关的数据治理、主数据与大数据技术又是什么?只有准确理解这些概念,才能少走弯路,正确构建属于我们自己的数据中台,逐步开展数据业务。

数据中台要求我们首先转变自己的思维模式和组织方式,以全新的业务模式与技术架构去迎接挑战。为了帮助大家准确理解数据中台概念,制订切实可行的数据中台发展战略,我们特此组织了此次课程。

课程收益

1. 了解数据治理的过程

2. 掌握主数据的概念及其特征

3. 熟悉数据中台的概念

受众人群

数据治理、数据仓库、数据建模、数据安全相关人员,技术工程师等人员。

课程周期

318小时)

课程大纲

主题

授课内容

第一单元 数据治理的过程

企业数字化转型

1. 为什么要进行企业数据化转型

案例:数据分析在企业产品创新过程中的作用与应用

2. 企业数据化转型的挑战

1) 组织结构的挑战:需求谁提?工作谁做?

2) 数据来源的挑战:更多渠道获取数据

3) 数据治理的挑战:数据看不懂、不可用

4) 数据应用的挑战:数据怎么能产生价值?

3. 数据资产管理

1) 数据资产管理的内容

2) 数据资产的构成:业务数据、分析数据、主数据

3) 数据资产管理的挑战

4) 数据治理面临的难题

4.  杂乱无章的数据来源

1)  晦涩难懂的数据语义

2)  千差万别的数据格式

3)  无处不在的数据问题

5. 数据治理的目标

1) 数据资产清理

2) 数据标准统一

3) 数据质量管理

4) 数据职责清晰

6. 数据治理的过程

1) 制定数据治理战略

2) 建立相关的组织与制度

a. 制度数据、数据源、数据安全、数据质量等方面的管理制度

b. 任命数据owner与数据管家,定义其“责权利”

3) 发布数据治理标准

4) 定义数据质量

5) 监控、反馈与评价

案例:以华为为例讲解数据治理的过程

1. 基础数据的治理

2. 主数据的治理

3. 事务数据的治理

4. 观测数据的治理

5. 规则数据的治理

案例:讲解数据湖的治理过程

1. 非结构化数据存储与数据湖

2. 基本特征识别(客观)

3. 增强特征识别(主观)

第二单元 主数据的管理

主数据的概念及其特征

1. 关键特征一致

2. 数据标识一致

3. 数据长期有效

4. 业务规则有效

主数据建设的过程

1. 没有主数据的数据治理:成本非常高

2. 开始建设主数据:数据治理与主数据建设并行开展

3. 建立起主数据系统:数据质量大幅度提高

主数据的范围:

1. 基础数据、组织机构、财务类数据

2. 物资设备、知识数据、客户/供应商

主数据系统架构:

1. 主数据采集、主数据治理、主数据业务管理

2. 主数据管控、主数据维护、主数据分发与数据安全

第三单元 元数据的管理

元数据治理面临的挑战:

1. 数据找不到、读不懂、不可信

元数据的概念与分类

1. 业务元数据、技术元数据、操作元数据

2. 消费侧、服务侧、数据主题侧、数据湖侧、数据源侧

案例讲解元数据治理的过程

1. 数据资产的整理与规范

2. 元数据的注册与采集

3. 元数据的版本管理与发布

元数据的分析与应用

1. 元数据分析与统计

2. 数据血缘管理

第四单元 数据质量管理

数据质量管理的挑战

1. 获取大量准确数据非常困难,不能满足分析需求

2. 获取大量、丰富但不太准确的数据(大数据时代特征)

数据质量的评价维度

1. 完整性、准确性、唯一性

2. 有效性、一致性、时效性

建立数据质量管理体系:

1. 事前:数据质量评估

2. 事前:数据质量评估

3. 事前:数据质量评估

数据质量管理的过程:ETL过程

1. 数据清洗及其实战举例

2. 数据转换及其实战举例

3. 数据集成及其实战举例

数据仓库建设

1. 主题数据模型(主题域划分)

2. 多维数据模型(事实表、维度表)

3. 数据仓库分层:STAGE, ODS, MID, DM

4. 数据仓库设计与运维

第五单元 数据安全及数据审计

数据安全

1. 数据存储安全

2. 数据传输安全

3. 数据使用安全

数据隐私保护

1. 数据隐私保护的作用

2. 数据隐私保护的方案

数据审计

1. 数据审计的概念

2. 关键数据更改的审计

3. 关键数据访问的审计


企业服务热线:400-106-2080
电话:18519192882
投诉建议邮箱:venus@bailinzhe.com
合作邮箱:service@bailinzhe.com
总部地址:
北京市-丰台区-汽车博物馆东路6号3号楼1单元902-B73(园区)
全国客户服务中心:
天津市-南开区-桂苑路15号鑫茂集团鑫茂军民园1号楼A座802-803
公众号
百林哲咨询(北京)有限公司 京ICP备2022035414号-1