第1 章 商业数据分析基础
1.1 商业数据分析的本质
1.2 商业数据分析中心的建设
第2 章 数据分析的武器库
2.1 数据挖掘简介
2.2 R 语言简介
2.3 R 与RStudio 的下载和安装
2.4 在RStudio 中安装包
2.5 练习题
第3 章 R 语言编程
3.1 R 的基本数据类型
3.2 R 的基本数据结构
3.3 R 的程序控制
3.4 R 的函数
3.5 R 的日期与时间数据类型
3.6 在R 中读写数据
3.7 练习题
第4 章 R 描述性统计分析与绘图
4.1 描述性统计分析
4.2 制图的步骤
4.3 R 基础绘图包
4.4 ggplot2 绘图
4.5 练习题
第5 章 数据整合和数据清洗
5.1 数据整合
5.2 R 中的高级数据整合
5.3 R 中的抽样
5.4 R 的数据清洗
5.5 练习题
第6 章 统计推断基础
6.1 基本的统计学概念
6.2 假设检验与单样本t 检验
6.3 双样本t 检验
6.4 方差分析(分类变量和连续变量关系检验)
6.5 相关分析(两连续变量关系检验)
6.6 卡方检验(二分类变量关系检验)
6.7 练习题
第7 章 客户价值预测:线性回归模型与诊断
7.1 相关性分析
7.2 线性回归
7.3 线性回归诊断
7.4 正则化方法
7.5 练习题
第8 章 Logistic 回归构建初始信用评级
8.1 Logistic 回归的相关关系分析
8.2 Logistic 回归模型及实现
8.3 最大熵模型与极大似然法估计
8.4 模型评估
8.5 练习题
第9 章 使用决策树进行信用评级
9.1 决策树建模思路
9.2 决策树算法
9.3 在R 中实现决策树
9.4 组合算法(Ensemble Learning)
9.5 练习题
第10 章 神经网络
10.1 神经元模型
10.2 人工神经网络模型
10.3 单层感知器
10.4 BP 神经网络
10.5 RBF 神经网络
10.6 神经网络设计与R 代码实现
10.7 练习题
第11 章 分类器入门:最近邻域与贝叶斯网络
11.1 分类器的概念
11.2 KNN 算法
11.3 朴素贝叶斯
11.4 贝叶斯网络
11.5 练习题
第12 章 高级分类器:支持向量机
12.1 线性可分与线性不可分
12.2 线性可分支持向量机
12.3 线性支持向量机
12.4 非线性支持向量机
12.5 R 中的支持向量机
12.6 练习题
第13 章 连续变量的维度归约
13.1 维度归约方法概述
13.2 主成分分析
13.3 因子分析
13.4 奇异值分解
13.5 对应分析和多维尺度分析
13.6 练习题
第14 章 聚类
14.1 聚类分析概述
14.2 聚类算法逻辑
14.3 层次聚类
14.4 k-means 聚类
14.5 基于密度的聚类
14.6 聚类模型的评估
14.7 高斯混合模型(Gaussian Mixture Model)
14.8 客户分群
14.9 练习题
第15 章 关联规则与推荐算法
15.1 长尾理论
15.2 关联规则
15.3 序贯模型
15.4 推荐算法与推荐系统
15.5 练习题
第16 章 时间序列建模
16.1 认识时间序列
16.2 简单时间序列分析
16.3 平稳时间序列分析ARMA 模型
16.4 非平稳时间序列分析ARIMA 模型
第17 章 特征工程(Feature Engineering)(博文视点官方网站下载)
17.1 特征工程概述
17.2 数据预处理(Data Preprocessing)
17.3 特征构造(Feature Construction)
17.4 特征抽取(Feature Extraction)
17.5 特征选择(Feature Selection)
第18 章 R 文本挖掘(博文视点官方网站下载)
18.1 文本挖掘
18.2 文本清洗
18.3 中文分词与文档模型
18.4 文本的特征选择及相关性度量
18.5 文本分类
18.6 主题模型
18.7 综合案例
附录A 数据说明(博文视点官方网站下载)