1. 分布关系
1.1. 分布是将一个类别按照类别内项目的数值进行分解
1.2. 分布关系常常与总分关系混淆
1.3. 表示分布关系的词语
-
1.3.1. 频率
-
1.3.2. 集中度
-
1.3.3. 分布
-
1.3.4. 值域
-
1.3.5. 正态曲线、正态分布、钟形曲线
1.4. 场景示例
-
1.4.1. 订单金额分布
-
1.4.2. 响应时间分析
-
1.4.3. 耗电量范围
1.5. 分布关系的常用数据图
-
1.5.1. 直方图
-
1.5.1.1. 最常见的分布数据图是直方图
-
1.5.1.2. 直方图将数据分成多个不同的值域,称为“区间”(bin)
-
1.5.1.3. 按照惯例,直方图的柱子之间是没有间隔的
-
1.5.1.4. 除非受众用过统计分析软件,否则未必能通过这个惯例认出直方图
-
1.5.1.5. 要认真做好标签,准备好向受众解释这种数据图
-
1.5.1.6. 直方图的适用场景
1.5.1.6.1. 表示单个变量的分布
1.5.1.6.2. 受众熟悉直方图
-
1.5.2. 频率多边形
-
1.5.3. 箱形图
-
1.5.3.1. 箱形图发明于20世纪60年代末,是一种比较新的数据可视化工具
-
1.5.3.2. 商业领域的受众往往需要沟通者做大量讲解,因为箱形图种类很多,而且需要受众对抽象统计概念有直观认识
-
1.5.3.3. 箱形图可以对有学术研究背景的受众使用—箱形图在学术界常用得多
-
1.5.3.4. 箱形图最适合需要比较多个分布的场合
1.5.3.4.1. 在这种情况下,频率多边形会把人看糊涂,而平均数等概括统计量又不足以描述数据
-
1.5.3.5. 使用箱形图应该注意的一点是,底层数据必须具有统计学上的单峰性
1.5.3.5.1. 单峰分布体现在直方图上,就是只有一个最高点
1.5.3.5.2. 有一个值或值域明显占据制高点
1.5.3.5.3. 箱形图不适合表现双峰分布,因为箱子不能体现出两个高点
-
1.5.3.6. 箱形图的适用场景
1.5.3.6.1. 比较多个类别的分布
1.5.3.6.2. 数据满足单峰性
1.5.3.6.3. 每个分布只需要少数区间即可描述
1.5.3.6.4. 类别的相对大小不是统计图要表达的重点
1.5.3.6.5. 时间充裕,可以向不熟悉箱形图的受众进行讲解
1.5.3.6.6. 受众熟悉四分位等抽象统计概念
1.6. 呈现分布关系的最佳实践
-
1.6.1. 用心选择区间
- 1.6.1.1. 在直方图中,等距区间对受众来说是最直观的
2. 相关关系
2.1. 相关关系指的是两个定量变量之间的关系,最常用散点图表示
2.2. 表示相关关系的词语
-
2.2.1. 随着……增加
-
2.2.2. 随着……减少
-
2.2.3. 随着……变化
-
2.2.4. 随着……变动
-
2.2.5. 与……相关
-
2.2.6. ……跟随……
2.3. 场景示例
-
2.3.1. 订单均价对下单频率的影响
-
2.3.2. 不同地区的盈利能力与增长率
-
2.3.3. 销售人员供职时长与销量
-
2.3.4. 通话时长与服务质量评分
-
2.3.5. 由降雪预测带动的铁锹销量
2.4. 表示因果关系的词语要慎用
-
2.4.1. 商业分析的一个常见目标,就是进一步理解因果关系,希望借此做出能达到预期效果的选择
-
2.4.2. 相关关系是理解因果关系的一个关键工具,因为它反映了一个指标的变化与另一个指标的关联
-
2.4.3. 相关性不等于因果性,而因果性才是大多数管理者追求的东西
-
2.4.4. 要留意以下表述
-
2.4.4.1. 由……导致
-
2.4.4.2. 由……造成
-
2.4.4.3. 在……的驱动下
-
2.4.4.4. 对……的影响
2.5. 相关关系的常用数据图
2.6. 呈现相关关系的最佳实践
3. 运用分类体系扩展数据图类型库
3.1. 要尽量使用常见的数据图类型,以便减轻受众的认知负荷
3.2. 要让受众聚焦于数据,而非数据图本身
来源:https://www.cnblogs.com/lying7/p/18978860 |