包邮Spark SQL大数据实例开发教程+入门与实践指南 数据存储管理分析书籍-so88
包邮Spark SQL大数据实例开发教程+入门与实践指南 数据存储管理分析书籍 pdf epub mobi txt 电子书 下载 2022
图书介绍
☆☆☆☆☆
||
王家林,纪涵,靖晓文,赵政达 著
店铺: 旷氏文豪图书专营店 出版社: 机械工业 ISBN:9787111591979 商品编码:26564402545 出版时间:2018-04-01
YL13848 9787111591979 9787302496700
Spark SQL大数据实例开发教程
Spark SQL是Spark生态环境中核心和基础的组件,是掌握Spark的关键所在。本书从企业级开发的角度出发,结合多个企业级应用案例,深入剖析Spark SQL。全书共分为8章,包括:认识Spark SQL、DataFrame原理与常用操作、Spark SQL操作多种数据源、Parquet列式存储、Spark SQL内置函数与窗口函数、Spark SQL UDF与UDAF、Thrift Server、Spark SQL综合应用案例。
本书可以使读者对Spark SQL有深入的理解,本书适合于Spark学习爱好者,是学习Spark SQL的入门和提高教材,也是Spark开发工程师开发过程中查阅Spark SQL的案头手册。
前言
第1章认识Spark SQL
1.1Spark SQL概述
1.1.1Spark SQL与DataFrame
1.1.2DataFrame与RDD的差异
1.1.3Spark SQL的发展历程
1.2从零起步掌握Hive
1.2.1Hive的本质是什么
1.2.2Hive安装和配置
1.2.3使用Hive分析搜索数据
1.3Spark SQL on Hive安装与配置
1.3.1安装Spark SQL
1.3.2安装MySQL
1.3.3启动Hive Metastore
1.4Spark SQL初试
1.4.1通过spark-shell来使用Spark SQL
1.4.2Spark SQL的命令终端
1.4.3Spark的Web UI
1.5本章小结
第2章DataFrame原理与常用操作
2.1DataFrame编程模型
2.2DataFrame基本操作实战
2.2.1数据准备
电子书下载地址:
相关电子书推荐:
- 文件名
- 人文科技 牛立红著
- 常微分算子
- 满58包邮 未来架构师(上、下) 9787540783747 《未来架构师》节目组著 漓
- 连续鞅和布朗运动
- 乔托的几何学遗产:科学革命前夕的美术与科学(何香凝美术馆 艺术史名著译丛) [美]小塞缪
- 商君书列子(足本典藏)/中华国学经典读本
- 你不是病人—— 来自癌症哲学门诊的处方笺
- 尚书要义(文渊阁四库全书珍赏系列)线装书局 1函6册 宣纸包背装
- 异构多无人机 :无人机系列 畅销书籍 正版 [西] Anibai,Ollero,Lvan,
- 德尔斐的囚徒:从苏格拉底到爱因斯坦
- 原子时代 9787535280206 (美)查利·塞缪尔斯(Charlie Samuels
- 东汉疑伪佛经的语言学考辨研究(国家哲学社会科学成果文库) 方一新, 高列過著
- 羚牛的故事(绿野寻踪) 9787503888939 雍严格,孙晋强;蒲春举 摄影-RT
- 现代数学基础丛书·典藏版8:有限群构造(上册)
- 视觉天下探索发现丛书:解秘古今悬疑大案