综合百科

平均值的计算公式是什么

平均值的计算公式是什么

早上,部门内的一位同事突然对我提出了一个疑问:“为什么使用Tableau计算出的平均值不准确呢?”这引起了我的注意,她正在尝试计算某公司客服部门的平均通话时长。总通话时长为300分钟,记录数为55条。从直观上看,平均通话时长应该是300除以55,即约5.45分钟。但在Tableau中计算出的结果却是5.77分钟。

显然,这两种计算方法之间存在差异,产生了所谓的“误差”。

相信许多刚开始接触Tableau的小伙伴可能会对此感到困惑:为什么会出现这种不一致呢?其实,不仅是你们,许多老客户在使用Tableau时也遇到过类似的问题。今天,我来为大家科普一下Tableau中关于平均值的计算逻辑。

针对同事提出的问题,我们首先要知道Tableau中有一个“查看数据”的功能,这对于经常需要计算的分析师来说是非常有用的。通过这个功能,我们可以了解Tableau中平均值的计算过程。

在Tableau的视图中,选中平均通话时长“5.77”,然后右键单击,选择“查看数据”,再选“完整数据”,这样就可以查看原始数据源中的基础数据了。为了更好地了解数据趋势,我们可以点击列标题对数据进行升序或降序排列。

这时候,我们会发现“通话时长”这一列存在三个空值。那么,问题就来了,Tableau在计算平均值时是否考虑了这三个空值呢?通过计算我们发现,如果不考虑这三个空值,即分母为52(排除空值的行数),计算出的结果恰好是5.77。这表明Tableau在计算平均值时是不考虑空值行的,也就是说空值的行数不会被计入分母的总数。如果“通话时长”列没有空值,那么分母自然就是55。

了解了这个计算逻辑后,有的客户可能会问:“如果我的业务需求就是要求总通话时长300除以含有空值行数的总和怎么办?”对于这个问题,我们可以通过创建计算字段来解决。有两种常用的方法:一是利用ZN函数将空值置零;二是直接利用记录数。这两种方法都可以得到正确的结果。同时我们也要明白,统计通话时长的行数时同样会忽略NULL值。这是因为平均值是反映数据分布的集中趋势的统计学概念,只考虑存在的有意义的集中趋势。如果有大量的空值存在时直接用总数除以会扭曲平均值的意义。所以我们在处理数据时也要注意对空值的处理是否合适业务场景。除了了解平均值的计算逻辑外我们还可以注意到一个工具:“记录数”。在分析数据源的时候它能帮助我们了解数据量的大小只需要将它拖入工作表中就能显示出对应字段的记录数即有多少行数满足条件便于我们对数据的整体情况进行初步的判断和理解。今天的分享就到这里如果大家对上述内容还有其他疑问欢迎留言交流共同探讨学习进步。


平均值的计算公式是什么

你可能也会喜欢...