第1章 全面认识数据图表 1
1.1 详解数据图表的基本构成 1
1.2 控制数据图表中的信息量 9
1.3 真的需要作图吗 10
第2章 建立数据图表的认知 14
2.1 利用散点图探究数据间的关系 14
2.1.1 最基本的散点图样例 15
2.1.2 散点图的制作 16
2.1.3 散点图的变种1:添加平滑线 19
2.1.4 散点图的变种2:利用气泡图观察更多指标间的关系 20
2.1.5 散点图的变种3:用分类矩阵形成决策 22
2.1.6 散点图的局限性 23
2.2 利用柱形图将“对比”做到极致 24
2.2.1 利用累加柱形图对比数据结构的变化 25
2.2.2 多指标组合对比 27
2.2.3 用平均值优化单指标的对比 29
2.2.4 用瀑布图观察总量分解后的对比 32
2.2.5 如何正确对比数值指标与比率指标 33
2.3 用折线图观察时间序列数据 35
2.3.1 如何观察趋势 36
2.3.2 探寻趋势变化的原因 38
2.4 利用面积图观察数据结构的变化趋势 44
2.4.1 观察动态的数据结构变化:堆积面积图 44
2.4.2 用于队列分析:堆积面积图 45
2.5 用雷达图进行静态的多维对比 48
2.6 其他类型图表概述 50
2.6.1 使用饼图的6个“坑” 50
2.6.2 提升视觉冲击力:树状图 52
2.6.3 量化流程各环节间的转化率:漏斗图 52
第3章 数据图表进阶 54
3.1 数据图表到底是什么 55
3.2 如何正确地选择图表 59
3.3 数据图表中的细节 60
3.3.1 图表背景和绘图区背景 60
3.3.2 坐标轴 65
3.3.3 灵活使用辅助线 68
3.3.4 线性趋势线的应用 69
3.3.5 应用移动平均趋势线做时间序列的预测 72
3.3.6 添加信息增强线 74
3.3.7 用标注线指示必要的信息 75
3.4 能让图表升级的高级技巧 76
3.4.1 运用组合图表增加信息承载量 76
3.4.2 运用子母图增加图表中的信息量 79
3.4.3 条件格式中的几项实用功能 80
3.4.4 使用迷你图表压缩空间 85
3.4.5 用不等宽技术优化柱形图和条形图 86
3.4.6 使用Bullet图进行绩效评价的可视化 89
第4章 数据化运营的基础知识 93
4.1 最基本的数据获取能力 94
4.1.1 认知数据库的一般构造 94
4.1.2 能够阅读最基本的取数代码 95
4.1.3 用Excel获取数据 98
4.2 快速认知数据 105
4.2.1 仔细审核数据源的质量 106
4.2.2 提升数据集的质量 107
4.2.3 统一数据类型和单位 111
4.2.4 描述统计分析 111
4.2.5 利用相关系数理解数据之间的关系 122
4.2.6 通过多维交叉深入认知数据集 125
4.3 几套有用的分析思维框架 132
4.3.1 66 法则与SQVID 原则 133
4.3.2 麦肯锡的“七步成诗” 135
4.4 创造指标,应用指标 141
4.4.1 什么是指标 142
4.4.2 如何设计高质量的指标 143
4.4.3 指标组合:综合指数 143
4.4.4 需要关注哪些核心指标 144
4.5 运营活动的量化 148
4.5.1 优秀的运营活动应具备哪些要素 148
4.5.2 需要哪些过程型和结果型指标 149
4.5.3 如何评价运营活动 149
4.5.4 从纵向与横向两个角度全面对比 151
4.5.5 一种更严谨的测试效果量化方法:DID 154
4.5.6 相似活动间效果的对比 155
4.5.7 关于运营活动量化的小结 156
4.6 数据化运营的思维方式 156
4.7 运营数据报告的必备要素 167
4.8 小结 170
第5章 快速提升量化分析能力. 171
5.1 用朴素贝叶斯模型进行预测 171
5.1.1 利用全概率公式的一个例子 174
5.1.2 让大数定律给你自信 175
5.1.3 窥一斑而见全豹:中心极限定理 176
5.2 使用假设检验进行理性的推断 177
5.2.1 统计分布是一切推断的基础 179
5.2.2 以正态分布为例,阐述假设检验的过程 181
5.2.3 双侧检验与单侧检验 183
5.2.4 假设检验的细节补充 184
5.3 利用方差分析辨别方案的有效性 185
5.3.1 用户激活措施的有效性判断 186
5.3.2 运用置信区间增强数值估计的可靠性 189
5.3.3 两两比较寻找最精确的结论 190
5.3.4 理解方差分析的思维 191
5.4 浅谈回归技术的应用 191
5.4.1 因变量与自变量的相关关系是回归的基础 191
5.4.2 线性回归建模的详细过程 192
5.4.3 线性回归分析中的注意点 204
5.5 用时间序列分解模型观察波动 204
5.5.1 怎样观察时间序列数据 205
5.5.2 何为时间序列分解 206
5.5.3 时间序列分解的步骤解析 208
5.5.4 时间序列分解方法的应用局限性 212
5.6 如何优化调查问卷 213
5.6.1 态度型问题,增加选项以支撑量化分析 214
5.6.2 问题要有必要且贴合业务需求 215
5.6.3 设置过滤器,识别无效回答 215
5.6.4 避免双重问题和一重半问题 216
5.6.5 动态地调查,设置问题库以保障多次调查的质量 216
第6章 科学地决策 217
6.1 从数据中形成决策 217
6.2 线性规划是什么 219
6.3 线性规划建模的操作过程 220
6.3.1 建立逻辑清晰的表格 220
6.3.2 设置输出单元格、目标单元格与可变单元格之前的运算关系 221
6.3.3 设置线性规划建模参数 222
6.4 如何从数据中形成决策 223
6.5 4 类典型且实用的线性规划模型 223
6.5.1 资源分配模型 224
6.5.2 成本收益平衡模型 226
6.5.3 网络配送模型 227
6.5.4 混合模型 229
6.6 线性规划模型小结 231
第7章 应用优秀的工具 233
7.1 互联网数据分析工具的演进 234
7.1.1 流量时代 234
7.1.2 用户时代 235
7.1.3 订单时代 235
7.2 行为事件分析工具的简单介绍 236
7.3 数据分析平台简介及趋势 238
7.3.1 数据展现 238
7.3.2 数据处理 238
7.3.3 数据收集 239
7.4 值得推荐的小工具 240
7.4.1 团队协作工具 240
7.4.2 其他小工具 241
第8章 工作经验杂谈 242
8.1 这些年犯过的错误 242
8.1.1 迷信业务模型,浪费公司资源 243
8.1.2 活跃率陷阱 244
8.1.3 不加选择地进行数据追踪 245
8.1.4 为了KPI 而做数据分析 246
8.1.5 忽略数据质量的保障机制 247
8.1.6 轻视业务执行,重视数据表现 248
8.1.7 不重视数据认知,盲目建模 248
8.1.8 只重视完成任务,忽略了团队成员的个人发展需求 249
8.2 认清数据分析的边界 250
8.2.1 数据库并不能记录一切 250
8.2.2 不可能分离多重因素影响 251
8.2.3 数据不能替代逻辑推理 251
8.2.4 预测的根基未必牢固 251
8.2.5 大多数人会因数据而变懒 252
8.3 我们需要读些什么书 252