【正版】Spark快速数据处理 系统讲解Spark的数据处理工具及使用方法 为快速编写高效-so88
【正版】Spark快速数据处理 系统讲解Spark的数据处理工具及使用方法 为快速编写高效 pdf epub mobi txt 电子书 下载 2022
图书介绍
☆☆☆☆☆
||
店铺: 纳卓图书专营店 ISBN:9787111463115 商品编码:25972515259 丛书名: Spark快速数据处理 出版时间:2014-04-01
机工 spark快数数据处理 | ||
定价 | 29.00 | |
出版社 | 机械工业出版社 | |
版次 | 第1版第1次印刷 | |
出版时间 | 2014年05月 | |
开本 | 大32开 | |
作者 | (美)凯洛 著,余璜 张磊 译 | |
装帧 | 平装 | |
页数 | 114 | |
字数 | --- | |
ISBN编码 | 9787111463115 |
Spark是一个开源的通用并行分布式计算框架,由加州大学伯克利分校的AMP实验室开发,支持内存计算、多迭代批量处理、即席查询、流处理和图计算等多种范式。Spark内存计算框架适合各种迭代算法和交互式数据分析,能够提升大数据处理的实时性和准确性,现已逐渐获得很多企业的支持,如、百度、网易、英特尔等公司。
本书系统讲解Spark的使用方法,包括如何在多种机器上安装Spark,如何配置一个Spark集群,如何在交互模式下运行个Spark作业,如何在Spark集群上构建一个生产级的脱机/独立作业,如何与Spark集群建立连接和使用SparkContext,如何创建和保存RDD(弹性分布式数据集),如何用Spark分布式处理数据,如何设置Shark,将Hive查询集成到你的Spark作业中来,如何测试Spark作业,以及如何提升Spark任务的性能。
译者序
作者简介
前言
第1章 安装Spark以及构建Spark集群
1.1 单机运行Spark
1.2 在EC2上运行Spark
1.3 在ElasticMapReduce上部署Spark
1.4 用Chef(opscode)部署Spark
1.5 在Mesos上部署Spark
1.6 在Yarn上部署Spark
1.7 通过SSH部署集群
1.8 链接和参考
1.9 小结
第2章 Sparkshell的使用
2.1 加载一个简单的text文件
2.2 用Sparkshell运行逻辑回归
2.3 交互式地从S3加载数据
2.4 小结
第3章 构建并运行Spark应用
3.1 用sbt构建Spark作业
3.2 用Maven构建Spark作业
3.3 用其他工具构建Spark作业
3.4 小结
第4章 创建SparkContext
4.1 Scala
4.2 Java
4.3 Java和Scala共享的API
4.4 Python
4.5 链接和参考
4.6 小结
第5章 加载与保存数据
5.1 RDD
5.2 加载数据到RDD中
5.3 保存数据
5.4 连接和参考
5.5 小结
第6章 操作RDD
6.1 用Scala和Java操作RDD
电子书下载地址:
相关电子书推荐:
- 文件名
- 影响人类的重大发明(全四册)(无盒)
- 特劳特营销十要(经典重译版) [A Genie's Wisdom: A Fable of How a CEO Learned to ]
- 中国未解之谜(精致图文版) 龚勋
- 老婆一句话决定老公的人生 老公一句话决定老婆的人生/滋润我们亲情家园的温馨故事 97871
- 《假如动物会说话》(函套书5册)——新奇迷人的动物科普绘本,充满想象与快乐的阅读之旅!
- 正版芊知性美女养成攻略9787511700711宋思颐
- 拉布拉多鸭的诅咒--对濒危物种的执著探寻/新视野人文丛书 (加拿大)格伦?奇尔顿
- 新员工安全教育
- 自然科学丛书:物种新老明星(彩图版) 马学宁
- 波达方向估计进展 9787118097368
- WL-美国国家地理知识小百科:岩石和矿物-[美] 史蒂夫·托米塞克,[德] 卡斯滕·彼得,
- 禅宗大意(正果法师佛学三书) 止观讲义 佛教基本知识 禅宗大意 宗教哲学佛学经典心
- 从粒子到宇宙:肉眼看不见的极美世界 天文航天 科普书籍
- 男人是猛的毒
- 微观世界的精灵 细菌与人类