上篇 使用R语言进行统计建模
第一章 R语言数据科学
1.1 基础操作
1.1.1 简介及安装
1.1.2 设置工作目录
1.1.3 数据导入和保存
1.1.3.1 R的数据结构
1.1.3.2 R的数据
1.1.3.3 数据的导入和保存
1.2 数据管理
1.2.1 传统数据框的操作和管理
1.2.1.1 一些常规操作
1.2.1.2 对数据框信息进行修改
1.2.1.3 数据操作的常用函数
1.2.2 tibble简单数据框的操作和管理
1.2.2.1 与传统的数据框比较
1.2.2.2 tibble数据的导入
1.2.2.3 数据管理 重要的五大函数
1.2.2.4 长、宽数据的相互转换
练习
第二章 数据探索:描述性统计和数据可视化
2.1 使用R对数据进行描述
2.1.1 趋中度和变异性:平均数、方差和标准差
2.1.1.1 概念
2.1.1.2 使用R计算平均数和标准差
2.1.2 趋中度和变异性:中位数(median)和四分位数(quartile)
2.1.3 趋中度和变异性:众数和幅度
2.1.4 其他描述统计方法
2.1.5 频数表和列联表
2.2 数据可视化
2.2.1 基础知识:R基础图形方法
2.2.1.1 图形的标题和坐标轴标签
2.2.1.2 符号、线条、颜色、文本属性
2.2.1.3 图形尺寸和边界尺寸
2.2.1.4 添加图例、自定义坐标轴、添加参考线、文本标注
2.2.2 几个常用绘图函数使用实例
2.2.2.1 plot()绘图函数
2.2.2.2 直方图、密度图和箱体图
2.2.3 Lattice包的几个绘图函数
2.2.4 ggplot 2绘图
2.2.4.1 几何对象函数geom_histogram()
2.2.4.2 几何对象函数geom_density()
2.2.4.3 几何对象函数geom_boxplot()
2.2.4.4 同时绘制多个几何对象
2.2.4.5 统计变换
2.2.4.6 总结
练习
第三章 从样本估计总体:概率分布和假设检验
3.1 z分布
3.2 t分布、F分布和x2分布