综合百科

详解频率直方图中位数的计算方法和公式步骤

经过对现有可视化资料的审视,我发现基础图表部分仍存在诸多不足之处,亟待完善。因此,我决定从今天起着手解决这些问题,争取尽快在多个常用软件中补齐常见基础图形的制作漏洞。在众多图表类型中,我决定先从数据维度最低的分类图表入手,经过筛选,目前主要分为四大类数据,而直方图作为其中最基础的一种,将是我们首先攻克的堡垒。

直方图的主要功能在于揭示数据的分布特征,虽然我们最常接触的是正态分布,但实际上数据分布形式远不止这一种。常见的分布类型还包括均匀分布、二项分布、泊松分布以及指数分布等。为了全面展示不同分布的特点,我们将逐一使用这些分布类型进行演示。

首先需要准备相应的数据集,这里我们选择最便捷的Excel工具来生成符合各种分布的数据,每类分布生成2048个数据点。以下是Excel中生成不同分布数据的公式,可以直接复制到单元格中使用↓

前三种分布类型可以通过简单的公式在单元格中拖拽填充即可生成,而剩余的几种分布则需要借助Excel的数据分析工具,具体操作步骤如下↓

首先打开Excel,点击顶部菜单栏的“数据”选项卡。在“数据分析”功能组中,找到并点击“数据分析”按钮。在弹出的数据分析对话框中,选择“随机数生成器”选项,然后点击“确定”。在随机数生成器设置界面中,选择合适的“分布类型”,即可开始生成数据。下面我们以具体示例演示一下↓对于最后两种分布类型,我们采用Python进行数据模拟,这种方法更为高效便捷,以下是相应的代码实现↓

【Excel图表制作】

数据准备工作完成后,我们就可以进入正题——绘制直方图了。以第一列数据为例进行初步演示↓

接下来,我们将根据数据图表的基本构成要素,逐步进行参数设置和美化。需要特别注意的是,直方图的核心调整参数主要有两个,通过调整BIn(区间数)的值,可以控制柱状图的宽度和数量,从而展示不同的数据分布特征。

左侧示例设置了50个BIn,右侧示例设置了20个BIn,具体数值可以根据实际需求进行调整。完成基础设置后,我们就可以按照相同的方法绘制剩余的图表。如果需要批量生成相同的图表,可以将当前图表保存为模板,后续直接套用模板即可,无需重复设置各项参数↓

【PowerBI应用】

在PowerBI中创建直方图的过程也相对简单,但需要注意的是,默认的视觉对象库中并不直接提供直方图选项,需要到市场(Marketplace)中搜索Histogram。

经过测试,虽然找到了几个可用的视觉对象,但它们的功能都比较有限,部分参数调节选项不足,甚至对于二项分布和泊松分布的数据处理出现了偏差。

【Python实现方法】

在Python环境中,绘制直方图非常直接,直接使用matplotlib库中的hist函数即可,只需添加相应的参数即可完成绘制↓

如果需要一次性绘制多个图表,可以使用以下代码将所有图表整合到同一画布中展示↓

【R语言实现】

在R语言中,推荐使用ggplot2包来创建高质量的图表,以下是绘制直方图的示例代码↓

同样,我们可以将六列数据整合到同一画布中进行展示,具体代码如下↓

以下是我使用PowerBI整理的历史文章链接,按照不同类型分类,方便大家根据需求查找:Microsoft Power BI↓

https://app.powerbi.com/view?r=eyJrIjoiNjI2NWQ3NjktYjU0ZC00ZWZhLTgzMDgtMGI4ZTk1ZDlkODM3IiwidCI6IjI3NDQ3MWQ0LTM4ZDQtNDVlZS1hMmJkLWU1NTVhOTBkYzM4NiJ9

结束