综合百科

手把手教你标准差计算公式轻松掌握

借助Excel软件,我们可以高效地完成一组样本数据的均值与标准差的计算任务,并且能够精确统计出落在特定区间的样本数量。

接下来,我们将利用Excel的功能,将这些统计结果以图形化的方式呈现出来,最终的图表效果如下所示:

除了运用柱状图来展示各个区间内的样本个数外,我们还可以在图表中叠加一条基于当前均值和标准差计算得出的正态分布曲线,以此来直观地评估实际样本统计分布与理论正态分布之间的吻合程度。

接下来,我们将详细探讨如何使用Excel软件完成上述的统计操作。

第一步:将样本数据输入Excel工作表

例如,假设我们有两组样本数据,分别记为y1和y2,我们的目标是计算这两组数据之间的差异,即y2-y1。

第二步:利用Excel计算均值和标准差

2.1 均值的计算:我们使用AVERAGE函数来计算均值。

若要计算E列中从E3到E14单元格范围内所有数值的均值,应输入公式 =AVERAGE(E3:E14)。

2.2 标准差的计算:我们使用STDEVP函数来计算标准差。

若要计算E列中从E3到E14单元格范围内所有数值的标准差,应输入公式=STDEVP(E3:E14)。

第三步:统计各个区间的样本数量

3.1 区间的划分:区间的划分是以计算出的均值mean和标准差sigma为基准,围绕均值mean,每个sigma范围作为一个独立的区间。

3.2 计算区间边界点的值:在完成第二步后,我们已经得到了mean和sigma的具体数值,此时,区间的边界点值可以通过简单的加减运算来确定,具体数值如图所示。

3.3 统计区间内的样本个数

为了统计落在特定区间内的样本数量,我们需要使用SUMPRODUCT函数。

例如,要统计落在mean-0.5sigma到mean+0.5sigma区间内的样本个数,应输入公式:

=SUMPRODUCT((E3:E14>=E20) * (E3:E14<E21))

其中,E3:E14代表样本数据所在的列,E20代表mean-0.5sigma的值,E21代表mean+0.5sigma的值。

完成上述统计后,表格将呈现如下所示的结果:

第四步:绘制图表

4.1 创建图表数据表:在Excel中,我们需要构建一个数据表,除了统计各区间的样本数量外,我们还需添加一列,用于计算在当前mean和sigma条件下,各个区间中点的正态分布概率密度值。

具体的计算方法,可以参考笔者之前在头条号发布的文章:

4.2 将数据表转换为图表:接下来,我们需要将数据表中的两列数据分别转换为柱状图和折线图,这里需要使用到插入组合图的功能。

首先,点击插入菜单,然后选择组合图,接着点击组合图选项中的第二个选项。

插入图表后,根据需要调整图表样式,最终效果应与之前展示的图表相似。