Hadoop构建数据仓库实践+Hive编程指南 2本 大数据技术书籍 数据库管理-so88
Hadoop构建数据仓库实践+Hive编程指南 2本 大数据技术书籍 数据库管理 pdf epub mobi txt 电子书 下载 2022
图书介绍
☆☆☆☆☆
||
王雪迎(美)卡普廖洛 著
店铺: 荣丰通达图书专营店 出版社: 清华大学出版社 ISBN:9787302469803 商品编码:26957784511
YL6894 9787302469803 9787115333834
Hadoop构建数据仓库实践
>
本书讲述在流行的大数据分布式存储和计算平台Hadoop上设计实现数据仓库,将传统数据仓库建模与SQL开发的简单性与大数据技术相结合,快速、高效地建立可扩展的数据仓库及其应用。 本书内容包括数据仓库、Hadoop及其生态圈的相关概念,使用Sqoop从关系数据库全量或增量抽取数据,使用HIVE进行数据转换和装载处理,使用Oozie调度作业周期性执行,使用Impala进行快速联机数据分析,使用Hue将数据可视化,以及数据仓库中的渐变维(SCD)、代理键、角色扮演维度、层次维度、退化维度、无事实的事实表、迟到的事实、累积的度量等常见问题在Hadoop上的处理等。本书适合数据库管理员、大数据技术人员、Hadoop技术人员、数据仓库技术人员,也适合高等院校和培训机构相关**的师生教学参考。>
第1章 数据仓库简介
1.1 什么是数据仓库 1
1.1.1 数据仓库的定义 1
1.1.2 建立数据仓库的原因 3
1.2 操作型与分析型 5
1.2.1 操作型 5
1.2.2 分析型 8
1.2.3 操作型和分析型对比 9
1.3 数据仓库架构 10
1.3.1 基本架构 10
1.3.2 主要数据仓库架构 12
1.3.3 操作数据存储 16
1.4 抽取-转换-装载 17
1.4.1 数据抽取 17
1.4.2 数据转换 19
1.4.3 数据装载 20
1.4.4 开发ETL的方法 21
1.4.5 常见ETL工具 21
1.5 数据仓库需求 22
1.5.1 基本需求 22
1.5.2 数据需求 23
1.6 小结 24
第2章 数据仓库设计基础
2.1 关系数据模型 25
2.1.1 关系数据模型中的结构 25
2.1.2 关系完整性 28
2.1.3 规范化 30
2.1.4 关系数据模型与数据仓库 33
2.2 维度数据模型 34
2.2.1 维度数据模型建模过程 35
2.2.2 维度规范化 36
2.2.3 维度数据模型的特点 37
2.2.4 星型模式 38
2.2.5 雪花模式 40
2.3 Data Vault模型 42
2.3.1 Data Vault模型简介 42
2.3.2 Data Vault模型的组成部分 43
2.3.3 Data Vault模型的特点 44
2.3.4 Data Vault模型的构建 44
2.3.5 Data Vault模型实例 46
2.4 数据集市 49 Hadoop构建数据仓库实践+Hive编程指南 2本 大数据技术书籍 数据库管理 电子书 下载 mobi epub pdf txt
电子书下载地址:
相关电子书推荐:
- 文件名
- 宝藏未解之谜 王春洪著
- 全球重武器TOP精选(珍藏版)深度军事编委会 军事书籍大全 清华大学出版社 军事爱好者
- {RT}寻访海洋生物-金翔龙 陆儒德 中译出版社(原中国对外翻译出版公司) 9787500
- 玩转装机与维修:从学徒到高手(附光盘)
- 奥秘世界
- 六韬·三略 原文+注释+译文 文白对照 中华国学经典精粹
- BF-无人机系统导论-(第4版)-(美)法尔斯特伦,(美)格里森,郭正 国防工业出版社 9
- Origin 9.0科技绘图与数据分析超级学习手册
- 从粒子到宇宙:肉眼看不见的极美世界 天文航天 科普书籍
- 中文版3ds Max 2014/VRay效果图制作完全自学教程
- BF-生活中的统计学-李倩星 清华大学出版社 9787302482697
- 制度自信:中国特色社会主义制度研究
- 国家地理野生动物大百科
- Java性能权威指南
- 书法入门-小牛顿百科馆