Hadoop权威指南:大数据的存储与分析(第4版)+HBase权威指南+Hive编程指南-so88
Hadoop权威指南:大数据的存储与分析(第4版)+HBase权威指南+Hive编程指南 pdf epub mobi txt 电子书 下载 2022
图书介绍
☆☆☆☆☆
||
店铺: 蓝墨水图书专营店 出版社: 清华大学出版社 ISBN:9787302465133 商品编码:19864790881 出版时间:2017-07-01
套装三册:
HBase权威指南
Hive编程指南
Hadoop权威指南:大数据的存储与分析(第4版)修订版
9787302465133 9787115333834 9787115318893
本书结合理论和实践,由浅入深,全方位介绍了Hadoop这一高性能的海量数据处理和分析平台。全书5部分24章,第Ⅰ部分介绍Hadoop基础知识,主题涉及Hadoop、MapReduce、Hadoop分布式文件系统、YARN、Hadoop的I/O操作。第Ⅱ部分介绍MapReduce,主题包括MapReduce应用开发;MapReduce的工作机制、MapReduce的类型与格式、MapReduce的特性。第Ⅲ部分介绍Hadoop的运维,主题涉及构建Hadoop集群、管理Hadoop。第Ⅳ部分介绍Hadoop相关开源项目,主题涉及Avro、Parquet、Flume、Sqoop、Pig、Hive、Crunch、Spark、HBase、ZooKeeper。第Ⅴ部分提供了三个案例,分别来自医疗卫生信息技术服务商塞纳(Cerner)、微软的人工智能项目ADAM(一种大规模分布式深度学习框架)和开源项目Cascading(一个新的针对MapReduce的数据处理API)。
本书是一本专业、全面的Hadoop参考书和工具书,阐述了Hadoop生态圈的新发展和应用,程序员可以从中探索海量数据集的存储和分析,管理员可以从中了解Hadoop集群的安装和运维。
第Ⅰ部分Hadoop基础知识
第1章初识Hadoop3
1.1数据!数据!3
1.2数据的存储与分析5
1.3查询所有数据6
1.4不仅仅是批处理7
1.5相较于其他系统的优势8
1.6ApacheHadoop发展简史12
1.7本书包含的内容16
第2章关于MapReduce19
2.1气象数据集19
2.2使用Unix工具来分析数据21
2.3使用Hadoop来分析数据22
2.4横向扩展31
2.5HadoopStreaming37
第3章Hadoop分布式文件系统42
3.1HDFS的设计42
3.2HDFS的概念44
3.3命令行接口50
3.4Hadoop文件系统52
3.5Java接口56
3.6数据流68
3.7通过distcp并行复制76
第4章关于YARN78
4.1剖析YARN应用运行机制79
4.2YARN与MapReduce1相比82
4.3YARN中的调度85
电子书下载地址:
相关电子书推荐:
- 文件名
- 分散性土研究 樊恒辉,孔令伟
- 正版新书 东非旅行Let’s Go 户外旅游书籍 东非自助旅行旅游书籍 肯尼亚 坦桑尼亚
- 舌尖上的丁香——中国的外来植物 香料 9787553507026 姚欢远-RT
- 战略节奏 湖北新华书店
- 强力与弱力:破解宇宙深层的隐匿魔法 畅销书籍 正版 地震强力与弱力-破解宇宙深层的隐匿魔法
- 大败局1+2全套修订版 吴晓波著 经济管理 中国企业商业创业史 企业管理与培训 畅销 新华书店正版
- 世界科普巨匠经典译丛:喜怒无常的天气 9787542762740
- 现货如何准备PMP考试 第6版+项目管理知识体系指南第六版(PMBOK指南)6版
- 乔托的几何学遗产:科学革命前夕的美术与科学(何香凝美术馆 艺术史名著译丛) [美]小塞缪
- 新华书店 户外探险与野外生存 书籍 体育运动
- 科普图书馆 小动物的大智慧:动物特种兵 9787542762122
- 纽约
- 50件简单易行的环保小事
- 2018全新版【五合一】南京CITY城市地图:江苏省全图+南京市全图+城区地图+浦口六合溧水高淳城区
- 贪婪的狐狸-做最棒的自己双语绘本-汉英对照