万本电子书0元读

万本电子书0元读

顶部广告

R语言电子书

该书深浅出地介绍 R 语言在大数据分析应用中的相关知识及编程。                                                                                                                     基础篇:讨论数据处理的R环境,包括R数据结构(数据框、列表等)、数据导/导出、数据清洗(处理数据的缺失值、不一致、异常值)、数据变换(汇总、集成、透视表、规约等)、可视化、高级语言编程、数据分析常用建模方法和原理,涵盖了目前数据挖掘的主要算法,包括分类与预测、聚类分析、关联规则、智能推荐和时序模式,利用可视化数据挖掘包Rattle行试验指导。

售       价:¥

纸质售价:¥45.40购买纸书

80人正在读 | 0人评论 6.2

作       者:程显毅,朱倩,刘鹏,张燕,刘颖

出  版  社:清华大学出版社

出版时间:2019-01-01

字       数:10.7万

所属分类: 科技 > 计算机/网络 > 程序设计

温馨提示:数字商品不支持退换货,不提供源文件,不支持导出打印

为你推荐

  • 读书简介
  • 目录
  • 累计评论(0条)
  • 读书简介
  • 目录
  • 累计评论(0条)
近年来,R语言可谓是数据分析的热门语言,相关的资料五花八门,让读者难以抉择。本书力求用简洁、精练,以理论与实践相结合的方式让大家快速掌握R语言。 全书共14章,第1章为绪论,从数学、统计学和逻辑学3个方面探讨了树立正确数据思维的一些原则;其余各章分为基础篇(第2~10章)、应用篇(第11、12章)和阶篇(第13、14章)。基础篇按照数据分析过程,主要讨论了R的数据结构、数据导/导出、数据清洗、数据变换、可视化、高级语言编程和常用建模方法。应用篇通过对2个经典案例的分析,使读者能够把学到的R基础知识应用到解决实际问题,把数据变成价值。阶篇解决如何用R处理大数据的一些技术。 本书可用作培养应用型人才的课程教材,也可作为数据分析爱好者的参考资料。<br/>【推荐语】<br/>该书深浅出地介绍 R 语言在大数据分析应用中的相关知识及编程。                                                                                                                     基础篇:讨论数据处理的R环境,包括R数据结构(数据框、列表等)、数据导/导出、数据清洗(处理数据的缺失值、不一致、异常值)、数据变换(汇总、集成、透视表、规约等)、可视化、高级语言编程、数据分析常用建模方法和原理,涵盖了目前数据挖掘的主要算法,包括分类与预测、聚类分析、关联规则、智能推荐和时序模式,利用可视化数据挖掘包Rattle行试验指导。 应用篇:讨论2个经典的数据分析报告案例,通过案例分析使读者能够把学到的R基础知识应用到解决实际问题中,把数据变成价值。 阶篇:解决R语言在处理大数据时性能低下的问题,讨论了两个R包:RHadoop、SparkR。                                                                                         本书注重实践;注重数据变成价值;注重大数据的分析。<br/>【作者】<br/>李法平- 副教授/系统分析师,硕士,重庆电子工程职业学院软件学院移动应用发教研室主任,主要从事高职软件类专业教学研究、教育信息化系统和企业信息化系统等应用技术研究。<br/>
目录展开

内容简介

总主编简介

本书主编简介

总 序

前 言

第1章 绪 论

1.1 为什么学习R语言

1.2 正确的数据思维观

习题

基础篇

第2章 R语言入门

2.1 新手上路

2.2 R语言开发环境部署

2.3 获取帮助

2.4 工作空间

2.5 脚本

2.6 R包

习题

第3章 数据类型

3.1 变量与常量

3.2 结构类型

3.3 字符串操作

3.4 用于数据处理和转换的常用函数

习题

第4章 数据准备

4.1 数据导入

4.2 数据导出

习题

第5章 数据可视化

5.1 低水平绘图命令

5.2 高水平绘图命令

5.3 交互式绘图命令

习题

第6章 数据探索

6.1 缺失值分析

6.2 异常值分析

6.3 不一致值分析

6.4 数据的统计特征分析

习题

第7章 数据变换

7.1 数据清洗

7.2 数据选择

7.3 数据集成

习题

第8章 高级编程

8.1 控制结构

8.2 用户自定义函数

习题

第9章 数据建模

9.1 Rattle包

9.2 聚类模型

9.3 关联分析模型

9.4 传统决策树模型

9.5 随机森林决策树模型

9.6 自适应选择决策树模型

9.7 SVM

9.8 线性回归模型

9.9 神经网络模型

习题

第10章 模型评估

10.1 数据集

10.2 混淆矩阵

10.3 风险图

10.4 ROC曲线

习题

应用篇

第11章 影响大学平均录取分数线因素分析

11.1 背景与目标

11.2 数据说明

11.3 描述性分析

11.4 总结与建议

第12章 收视率分析

12.1 背景介绍

12.2 数据说明

12.3 描述性分析

12.4 总结与建议

进阶篇

第13章 RHadoop

13.1 认识RHadoop

13.2 RHadoop安装

13.3 综合练习

习题

第14章 SparkR

14.1 认识SparkR

14.2 SparkDataFrame

14.3 SparkR支持的机器学习算法

14.4 综合练习

习题

参考文献

附录 大数据和人工智能实验环境

累计评论(0条) 0个书友正在讨论这本书 发表评论

发表评论

发表评论,分享你的想法吧!

买过这本书的人还买过

读了这本书的人还在读

回顶部