点击选择搜索分类
首页 - 进口原版- 正文
☆☆☆☆☆
||
[美] Daniel,D.,Gutierrez,古铁雷斯 著,施翊 译
出版社: 人民邮电出版社 ISBN:9787115452405 版次:01 商品编码:12197870 品牌:异步图书 包装:平装 开本:小16开 出版时间:2017-05-01 页数:242 正文语种:中文
本书包括以下内容:
机器学习概述 监督机器学习
数据连接 非监督机器学习
数据处理 模型评估
探索性数据分析
本书选用R统计环境。R在全世界范围内应用越来越广泛,很多数据科学家只使用R就能进行项目工作。本书的所有代码示例都是用R语言写的。除此之外,书中还使用了很多流行的R包和数据集。
本书试图指导读者掌握如何完成涉及机器学习的数据科学项目。本书将为数据科学家提供一些在统计学习领域会用到的工具和技巧,涉及数据连接、数据处理、探索性数据分析、监督机器学习、非监督机器学习和模型评估。本书选用的是R统计环境,书中所有代码示例都是用R语言编写的,涉及众多流行的R包和数据集。
本书适合数据科学家、数据分析师、软件开发者以及需要了解数据科学和机器学习方法的科研人员阅读参考。
1.1 机器学习的分类 2
1.2 机器学习的实际案例 3
1.2.1 预测回头客挑战赛 4
1.2.2 Netflix公司 5
1.2.3 算法交易挑战赛 6
1.2.4 Heritage健康奖 7
1.3 机器学习的过程 10
1.4 机器学习背后的数学 15
1.5 成为一名数据科学家 16
1.6 统计计算的R工程 18
1.7 RStudio 19
1.8 使用R包 20
1.9 数据集 22
1.10 在生产中使用R 23
1.11 小结 24
第2章 连接数据 25
2.1 管理你的工作目录 27
2.2 数据文件的种类 28
2.3 数据的来源 28
2.4 从网络中下载数据集 29
2.5 读取CSV文件 31
2.6 读取Excel文件 33
2.7 使用文件连接 34
2.8 读取JSON文件 35
2.9 从网站中抓取数据 36
2.10 SQL数据库 38
2.11 R中的SQL等价表述 42
2.12 读取Twitter数据 46
2.13 从谷歌分析中读取数据 48
2.14 写数据 51
2.15 小结 53
第3章 数据处理 54
3.1 特征工程 57
3.2 数据管道 59
3.3 数据采样 60
3.4 修正变量名 60
3.5 创建新变量 62
3.6 数值离散化 63
3.7 日期处理 65
3.8 将类变量二值化 67
3.9 合并数据集 68
3.10 排列数据集 70
3.11 重塑数据集 71
3.12 使用dplyr进行数据操作 72
3.13 处理缺失数据 75
3.14 特征缩放 77
3.15 降维 78
3.16 小结 81
第4章 探索性数据分析 83
4.1 数据统计 84
4.2 探索性可视化 87
4.3 直方图 88
4.4 箱形图 89
4.5 条形图 92
4.6 密度图 93
4.7 散点图 95
4.8 QQ图 101
4.9 热图 102
4.10 缺失值的图表 103
4.11 解释性图表 104
4.12 小结 106
第5章 回归 107
5.1 一元线性回归 108
5.2 多元线性回归 120
5.3 多项式回归 127
5.4 小结 134
第6章 分类 136
6.1 一个简单的例子 137
6.2 逻辑回归 139
6.3 分类树 143
6.4 朴素贝叶斯 147
6.5 K-最近邻 151
6.6 支持向量机 155
6.7 神经网络 159
6.8 集成 165
6.9 随机森林 168
6.10 梯度提升机 171
6.11 小结 174
第7章 评估模型性能 176
7.1 过拟合 177
7.2 偏差和方差 183
7.3 干扰因子 187
7.4 数据泄漏 188
7.5 测定回归性能 190
7.6 测定分类性能 194
7.7 交叉验证 197
7.8 其他机器学习诊断法 204
7.8.1 获取更多的训练观测数据 205
7.8.2 特征降维 205
7.8.3 添加新特征 205
7.8.4 添加多项式特征 206
7.8.5 对正则化参数进行微调 206
7.9 小结 206
第8章 非监督学习 208
8.1 聚类 209
8.2 模拟聚类 211
8.3 分级聚类 212
8.4 K-均值聚类 219
8.5 主成分分析 224
8.6 小结 233
术语表 234
机器学习与数据科学 基于R的统计学习方法 电子书 下载 mobi epub pdf txt
机器学习与数据科学 基于R的统计学习方法-so88
机器学习与数据科学 基于R的统计学习方法 pdf epub mobi txt 电子书 下载 2022
图书介绍
☆☆☆☆☆
||
[美] Daniel,D.,Gutierrez,古铁雷斯 著,施翊 译
出版社: 人民邮电出版社 ISBN:9787115452405 版次:01 商品编码:12197870 品牌:异步图书 包装:平装 开本:小16开 出版时间:2017-05-01 页数:242 正文语种:中文
编辑推荐
从业者使用的工具是决定他的工作能否成功的重要因素之一。本书为数据科学家提供了一些在统计学习领域会用到的工具和技巧,为他们在数据科学领域的长期职业生涯提供了所需的一套基本工具。针对处理重要的数据科学问题的高级技能,本书也给出了学习的建议。本书包括以下内容:
机器学习概述 监督机器学习
数据连接 非监督机器学习
数据处理 模型评估
探索性数据分析
本书选用R统计环境。R在全世界范围内应用越来越广泛,很多数据科学家只使用R就能进行项目工作。本书的所有代码示例都是用R语言写的。除此之外,书中还使用了很多流行的R包和数据集。
内容简介
当前,机器学习和数据科学都是很重要和热门的相关学科,需要深入地研究学习才能精通。本书试图指导读者掌握如何完成涉及机器学习的数据科学项目。本书将为数据科学家提供一些在统计学习领域会用到的工具和技巧,涉及数据连接、数据处理、探索性数据分析、监督机器学习、非监督机器学习和模型评估。本书选用的是R统计环境,书中所有代码示例都是用R语言编写的,涉及众多流行的R包和数据集。
本书适合数据科学家、数据分析师、软件开发者以及需要了解数据科学和机器学习方法的科研人员阅读参考。
作者简介
Daniel D. Gutierrez是一位在职的数据科学家,就职于加州Santa Monica的咨询公司AMULET Analytics。为了紧跟行业的潮流,Daniel也是insideBIGDATA.com的执行编辑。同时,他也是一位教师,为大学和大型公司开设了数据科学、机器学习和R方面的课程。Deniel本科毕业于UCLA,专业是数学和计算机科学。目录
第1章 机器学习综述 11.1 机器学习的分类 2
1.2 机器学习的实际案例 3
1.2.1 预测回头客挑战赛 4
1.2.2 Netflix公司 5
1.2.3 算法交易挑战赛 6
1.2.4 Heritage健康奖 7
1.3 机器学习的过程 10
1.4 机器学习背后的数学 15
1.5 成为一名数据科学家 16
1.6 统计计算的R工程 18
1.7 RStudio 19
1.8 使用R包 20
1.9 数据集 22
1.10 在生产中使用R 23
1.11 小结 24
第2章 连接数据 25
2.1 管理你的工作目录 27
2.2 数据文件的种类 28
2.3 数据的来源 28
2.4 从网络中下载数据集 29
2.5 读取CSV文件 31
2.6 读取Excel文件 33
2.7 使用文件连接 34
2.8 读取JSON文件 35
2.9 从网站中抓取数据 36
2.10 SQL数据库 38
2.11 R中的SQL等价表述 42
2.12 读取Twitter数据 46
2.13 从谷歌分析中读取数据 48
2.14 写数据 51
2.15 小结 53
第3章 数据处理 54
3.1 特征工程 57
3.2 数据管道 59
3.3 数据采样 60
3.4 修正变量名 60
3.5 创建新变量 62
3.6 数值离散化 63
3.7 日期处理 65
3.8 将类变量二值化 67
3.9 合并数据集 68
3.10 排列数据集 70
3.11 重塑数据集 71
3.12 使用dplyr进行数据操作 72
3.13 处理缺失数据 75
3.14 特征缩放 77
3.15 降维 78
3.16 小结 81
第4章 探索性数据分析 83
4.1 数据统计 84
4.2 探索性可视化 87
4.3 直方图 88
4.4 箱形图 89
4.5 条形图 92
4.6 密度图 93
4.7 散点图 95
4.8 QQ图 101
4.9 热图 102
4.10 缺失值的图表 103
4.11 解释性图表 104
4.12 小结 106
第5章 回归 107
5.1 一元线性回归 108
5.2 多元线性回归 120
5.3 多项式回归 127
5.4 小结 134
第6章 分类 136
6.1 一个简单的例子 137
6.2 逻辑回归 139
6.3 分类树 143
6.4 朴素贝叶斯 147
6.5 K-最近邻 151
6.6 支持向量机 155
6.7 神经网络 159
6.8 集成 165
6.9 随机森林 168
6.10 梯度提升机 171
6.11 小结 174
第7章 评估模型性能 176
7.1 过拟合 177
7.2 偏差和方差 183
7.3 干扰因子 187
7.4 数据泄漏 188
7.5 测定回归性能 190
7.6 测定分类性能 194
7.7 交叉验证 197
7.8 其他机器学习诊断法 204
7.8.1 获取更多的训练观测数据 205
7.8.2 特征降维 205
7.8.3 添加新特征 205
7.8.4 添加多项式特征 206
7.8.5 对正则化参数进行微调 206
7.9 小结 206
第8章 非监督学习 208
8.1 聚类 209
8.2 模拟聚类 211
8.3 分级聚类 212
8.4 K-均值聚类 219
8.5 主成分分析 224
8.6 小结 233
术语表 234
机器学习与数据科学 基于R的统计学习方法 电子书 下载 mobi epub pdf txt
电子书下载地址:
相关电子书推荐:
- 文件名
- 可操作的地震预测预报
- 初中英语 九年级全一册 牛津版 2018版初中同步 5年中考3年模拟 曲一线科学备考
- BF-灭绝的物种能复活吗-《科普基石丛书》编委会 四川科学技术出版社 9787536486
- 我從地獄爬回來! 有吉弘行的毒舌生存之道
- 化学热点漫话
- 牛津英文经典:爱伦·坡小说精选(英文版)
- 大脑赋能术
- 高中英语星级训练:阅读理解+完形填空(高考新题型)
- 科普供给侧的革命 9787504676320
- 自然的簫聲:莊子說02
- 玛雅大预言
- 【中商原版】印度之旅(英国殖民文学三大经典之一,E. M. 佛斯特一部长篇巨着) 港台原版
- 汉字树(2)
- 6个月学会任何一种外语
- 满58包邮 推动丛书物理系列:亚原子粒子的发现 9787535795090 斯蒂芬温伯格