包邮Spark SQL大数据实例开发教程+入门与实践指南 数据存储管理分析书籍-so88
包邮Spark SQL大数据实例开发教程+入门与实践指南 数据存储管理分析书籍 pdf epub mobi txt 电子书 下载 2022
图书介绍
☆☆☆☆☆
||
王家林,纪涵,靖晓文,赵政达 著
店铺: 旷氏文豪图书专营店 出版社: 机械工业 ISBN:9787111591979 商品编码:26564402545 出版时间:2018-04-01
YL13848 9787111591979 9787302496700
Spark SQL大数据实例开发教程
Spark SQL是Spark生态环境中核心和基础的组件,是掌握Spark的关键所在。本书从企业级开发的角度出发,结合多个企业级应用案例,深入剖析Spark SQL。全书共分为8章,包括:认识Spark SQL、DataFrame原理与常用操作、Spark SQL操作多种数据源、Parquet列式存储、Spark SQL内置函数与窗口函数、Spark SQL UDF与UDAF、Thrift Server、Spark SQL综合应用案例。
本书可以使读者对Spark SQL有深入的理解,本书适合于Spark学习爱好者,是学习Spark SQL的入门和提高教材,也是Spark开发工程师开发过程中查阅Spark SQL的案头手册。
前言
第1章认识Spark SQL
1.1Spark SQL概述
1.1.1Spark SQL与DataFrame
1.1.2DataFrame与RDD的差异
1.1.3Spark SQL的发展历程
1.2从零起步掌握Hive
1.2.1Hive的本质是什么
1.2.2Hive安装和配置
1.2.3使用Hive分析搜索数据
1.3Spark SQL on Hive安装与配置
1.3.1安装Spark SQL
1.3.2安装MySQL
1.3.3启动Hive Metastore
1.4Spark SQL初试
1.4.1通过spark-shell来使用Spark SQL
1.4.2Spark SQL的命令终端
1.4.3Spark的Web UI
1.5本章小结
第2章DataFrame原理与常用操作
2.1DataFrame编程模型
2.2DataFrame基本操作实战
2.2.1数据准备
电子书下载地址:
相关电子书推荐:
- 文件名
- 恐龙时代的秘密
- 九州·斛珠夫人
- 科技发展五十年 遥望地外星球
- 植物与景观丛书:彩叶植物与景观
- 幻想的奇迹:技术发明99
- 零起点学创业系列:零起点学办肉羊养殖场
- 他们应当行走:美国往事之小儿麻痹症 9787302393900 [美]戴维M. 奥辛斯基(
- 你的世界让你拥有
- 满58包邮 天外有天系列:建造太空城市 9787543975279 上海科学技术文献出
- 养羊技术指导(第3次修订版)
- 狡猾的发明 绝妙的机器 9787200107487
- 且把年华赠天下之点红妆(套装上中下册 附:海报、书签、手写情书折页)
- 人一生不可不知的科学理论
- 执业兽医从业指南
- 十万个为什么·人文 生活交通 朱立红著