【现货正版】Spark快速数据处理 系统讲解Spark的数据处理工具及使用方法 为快速编写-so88
【现货正版】Spark快速数据处理 系统讲解Spark的数据处理工具及使用方法 为快速编写 pdf epub mobi txt 电子书 下载 2022
图书介绍
☆☆☆☆☆
||
店铺: 广结良缘图书专营店 ISBN:9787111463115 商品编码:26872014210 丛书名: Spark快速数据处理 出版时间:2014-04-01
|
机工 spark快数数据处理 | ||
定价 | 29.00 | |
出版社 | 机械工业出版社 | |
版次 | 1版1次印刷 | |
出版时间 | 2014年05月 | |
开本 | 大32开 | |
作者 | (美)凯洛 著,余璜 张磊 译 | |
装帧 | 平装 | |
页数 | 114 | |
字数 | --- | |
ISBN编码 | 9787111463115 |
Spark是个开源的通用并行分布式计算框架,由加州大学伯克利分校的AMP实验室开发,支持内存计算、多迭代批量处理、即席查询、流处理和图计算等多种范式。Spark内存计算框架适合各种迭代算法和交互式数据分析,能够提升大数据处理的实时性和准确性,现已逐渐获得很多企业的支持,如阿里巴巴、百度、网易、英特尔等公司。
本书系统讲解Spark的使用方法,包括如何在多种机器上安装Spark,如何配置个Spark集群,如何在交互模式下运行个Spark作业,如何在Spark集群上构建个生产级的脱机/独立作业,如何与Spark集群建立连接和使用SparkContext,如何创建和保存RDD(弹性分布式数据集),如何用Spark分布式处理数据,如何设置Shark,将Hive查询集成到你的Spark作业中来,如何测试Spark作业,以及如何提升Spark任务的性能。
译者序
作者简介
前言
1章 安装Spark以及构建Spark集群
1.1 单机运行Spark
1.2 在EC2上运行Spark
1.3 在ElasticMapReduce上部署Spark
1.4 用Chef(opscode)部署Spark
1.5 在Mesos上部署Spark
1.6 在Yarn上部署Spark
1.7 通过SSH部署集群
1.8 链接和参考
1.9 小结
2章 Sparkshell的使用
2.1 加载个简单的text文件
2.2 用Sparkshell运行逻辑回归
2.3 交互式地从S3加载数据
2.4 小结
3章 构建并运行Spark应用
3.1 用sbt构建Spark作业
3.2 用Maven构建Spark作业
3.3 用其他工具构建Spark作业
3.4 小结
4章 创建SparkContext
4.1 Scala
4.2 Java
4.3 Java和Scala共享的API
4.4 Python
4.5 链接和参考
4.6 小结
5章 加载与保存数据
5.1 RDD
5.2 加载数据到RDD中
5.3 保存数据
电子书下载地址:
相关电子书推荐:
- 文件名
- 雷杜德花卉与果实全鉴 畅销书籍 时尚生活 正版 (法)雷杜德 绘
- 应急管理在银行业数据中心的策略与实践
- 科普供给侧的革命 9787504676320
- 详解经典电子电路200例 付少波,何惠英
- 科学可以这样看丛书:失落的非洲寺庙 9787229126308 [南非] 迈克尔特林格-R
- 通信原理与系统 南利平 9787304018870
- BF-自然的概念-(英)怀特海 译林出版社 9787544722919
- RTDK 钩针编织的可爱花片130和28款小物件 9787534988516 河南科学技术
- 文化伟人代表作图释书系:相对论 全新修订版 创世之书 彻底颠覆人类时空观与宇宙观 是读者首肯的新版本
- Altium Designer 10从入门到精通(计算机辅助设计与制造CAD/CAM系列)
- 19世纪不明现象编年史(101个震惊世界的未解之谜) (德)豪斯多夫,李楠,李雯
- 京东配送 移动宽带技术——LTE 9787115279484
- 狮子:野生动物生活实录(简装)
- 激光原理及应用(第3版)激光发展简史激光特性激光产生原理激光应用激光器工作特性 光电子技术
- 北京花开 韩静华