点击选择搜索分类
首页 - 工业技术- 正文
☆☆☆☆☆
||
[美] Kevin Sitto(凯文·斯托),[美] Marshall Presser(马歇尔·普瑞斯) 著
出版社: 中国电力出版社 ISBN:9787512395985 版次:1 商品编码:12005169 包装:平装 开本:16开 出版时间:2016-11-01 用纸:胶版纸 页数:124 字数:123000 正文语种:中文
本书将帮助你决定Hadoop中哪些组件适合完成你的项目。
主要包括如下主题:核心技术,Hadoop分布式文件系统(HDFS)、MapReduce、YARN和Spark。数据库和数据管理,Cassandra、HBase、MongoDB和Hive。序列化,Avro、JSON和Parquet。管理和监视,Puppet、Chef、Zookeeper和Oozie。分析辅助,Pig、Mahout和MLLib。数据传输,Scoop、Flume、distcp和Storm。安全、访问控制和审计,Sentry、Kerberos和Knox。云计算和虚拟化,Serengeti、Docker和Whirr。
Marshall Presser,是Pivotal Data Engineering集团的成员。他帮助客户使用Hadoop、关系数据库和内存数据网格来解决复杂的分析问题。
第1章关键技术 7
1.1 Hadoop分布式文件系统(HDFS) 8
1.2 MapReduce . 11
1.3 YARN 13
1.4 Spark . 15
第2章数据库及数据管理 17
2.1 Cassandra .19
2.2 HBase 21
2.3 Accumulo .24
2.4 Memcached . 26
2.5 Blur .28
2.6 Solr . 30
2.7 MongoDB 32
2.8 Hive 34
2.9 Spark SQL ( 前身是 Shark) 36
2.10 Giraph . 38
第3章序列化 41
3.1 Avro 43
3.2 JSON 46
3.3 Protocol Buffers (protobuf) . 48
3.4 Parquet 50
第4章管理与监控. 53
4.1 Ambari 54
4.2 HCatalog 56
4.3 Nagios 58
4.4 Puppet 59
4.5 Chef 61
4.6 ZooKeeper 63
4.7 Oozie . 66
4.8 Ganglia . 68
第5章分析辅助 . 69
5.1 MapReduce 接口69
5.2 分析库 70
5.3 Pig 72
5.4 Hadoop Streaming 74
5.5 Mahout 76
5.6 MLLib 78
5.7 Hadoop 图像处理接口(HIPI) 80
5.8 SpatialHadoop 81
第6章数据传输 . 83
6.1 Sqoop .85
6.2 Flume .87
6.3 DistCp 89
6.4 Storm . 90
第7章安全、访问控制和审计 93
7.1 Sentry. 95
7.2 Kerberos 97
7.3 Knox 99
第8章云计算和虚拟化 101
8.1 Serengeti. 103
8.2 Docker105
8.3 Whirr 107
Hadoop生态系统 电子书 下载 mobi epub pdf txt
Hadoop生态系统-so88
Hadoop生态系统 pdf epub mobi txt 电子书 下载 2022
图书介绍
☆☆☆☆☆
||
[美] Kevin Sitto(凯文·斯托),[美] Marshall Presser(马歇尔·普瑞斯) 著
出版社: 中国电力出版社 ISBN:9787512395985 版次:1 商品编码:12005169 包装:平装 开本:16开 出版时间:2016-11-01 用纸:胶版纸 页数:124 字数:123000 正文语种:中文
编辑推荐
适读人群 :《Hadoop生态系统》广大读者。本书将帮助你决定Hadoop中哪些组件适合完成你的项目。
内容简介
《Hadoop生态系统》本书每一章都介绍了不同的主题(例如核心技术或数据传输),并且解释了为什么特定组件适用或不适用特定的需求。对于数据处理来说,使用Hadoop是一个全新的挑战,但如果有了这本便利的参考书,你将很容易领会使用Hadoop的精妙所在。主要包括如下主题:核心技术,Hadoop分布式文件系统(HDFS)、MapReduce、YARN和Spark。数据库和数据管理,Cassandra、HBase、MongoDB和Hive。序列化,Avro、JSON和Parquet。管理和监视,Puppet、Chef、Zookeeper和Oozie。分析辅助,Pig、Mahout和MLLib。数据传输,Scoop、Flume、distcp和Storm。安全、访问控制和审计,Sentry、Kerberos和Knox。云计算和虚拟化,Serengeti、Docker和Whirr。
作者简介
Kevin Sitto,是Pivotal Software公司的领域解决方案工程师,主要为客户提供咨询服务,帮助客户理解和描述大数据需求。Marshall Presser,是Pivotal Data Engineering集团的成员。他帮助客户使用Hadoop、关系数据库和内存数据网格来解决复杂的分析问题。
目录
前言 1第1章关键技术 7
1.1 Hadoop分布式文件系统(HDFS) 8
1.2 MapReduce . 11
1.3 YARN 13
1.4 Spark . 15
第2章数据库及数据管理 17
2.1 Cassandra .19
2.2 HBase 21
2.3 Accumulo .24
2.4 Memcached . 26
2.5 Blur .28
2.6 Solr . 30
2.7 MongoDB 32
2.8 Hive 34
2.9 Spark SQL ( 前身是 Shark) 36
2.10 Giraph . 38
第3章序列化 41
3.1 Avro 43
3.2 JSON 46
3.3 Protocol Buffers (protobuf) . 48
3.4 Parquet 50
第4章管理与监控. 53
4.1 Ambari 54
4.2 HCatalog 56
4.3 Nagios 58
4.4 Puppet 59
4.5 Chef 61
4.6 ZooKeeper 63
4.7 Oozie . 66
4.8 Ganglia . 68
第5章分析辅助 . 69
5.1 MapReduce 接口69
5.2 分析库 70
5.3 Pig 72
5.4 Hadoop Streaming 74
5.5 Mahout 76
5.6 MLLib 78
5.7 Hadoop 图像处理接口(HIPI) 80
5.8 SpatialHadoop 81
第6章数据传输 . 83
6.1 Sqoop .85
6.2 Flume .87
6.3 DistCp 89
6.4 Storm . 90
第7章安全、访问控制和审计 93
7.1 Sentry. 95
7.2 Kerberos 97
7.3 Knox 99
第8章云计算和虚拟化 101
8.1 Serengeti. 103
8.2 Docker105
8.3 Whirr 107
Hadoop生态系统 电子书 下载 mobi epub pdf txt
电子书下载地址:
相关电子书推荐:
- 文件名
- 上下五千年难解之谜3
- 姜小牙上学记:好朋友争夺战 北猫
- 宇宙中的生命(翻译版 第3版)
- 做的项目经理
- 气候变化领域本体手册
- 满28包邮 中国城乡公路网及里程地图集
- 可操作的地震预测预报
- 正版 极致产品 商业管理商业实践360集团创始人兼CEO周鸿祎倾囊相授从0到1打造爆品的实战指南
- 科学的旅程(珍藏版) 雷·斯潘根贝格
- 战略性品牌管理与控制
- 探秘死亡的真相 《科学传奇——探索人体的奥秘》编委会著
- 请给我结果3:要结果,从我做起 中信出版社
- 品读科-神奇世界全知道(动物奥秘 植物王国)
- 沙发旅行(睡在陌生的沙发上,我不害怕) 9787807297659 凤凰出版社
- 贪玩的人类——那些将我们带进科学的人 9787030271341 李建荣(老多)-RT