
招呼读者朋友并介绍文章背景
大家好呀我是你们的老朋友,一个超级喜欢和数据打交道的人今天我要跟大家聊一个超级重要的话题——《平均数中位数众数大揭秘,带你轻松读懂数据背后的秘密》咱们平时看新闻、逛论坛,是不是经常看到各种数据什么”平均工资”、”中位数房价”、”最受欢迎的车型”等等这些数字看着挺专业,但你知道它们到底意味着什么吗其实啊,平均数、中位数和众数这三兄弟,就像数据世界的三大门派,每个都有自己独特的本事和解读方式今天我就要带大家一起揭开它们的神秘面纱,让你以后看到数据不再懵懵懂懂,而是能一眼看穿其中的真相
第一章:认识平均数——数据世界的”老好人”
第一章:认识平均数——数据世界的”老好人”
说到平均数啊,那可是数据世界里最常见、最接地气的存在了咱们人管它叫”算术平均数”,简单说就是所有数据加起来再除以数据的个数比如小明期末考试语文90分、数学95分、英语88分,那他的平均分就是(90+95+88)/3=91分是不是超级简单
但别看平均数计算起来简单,它在数据分析中的地位可一点都不简单咱们平时说的”平均工资”、”平均气温”、”平均成绩”等等,都是用平均数来衡量的它就像个”老好人”,把所有的数据都平等对待,不管你是高数还是低数,一视同仁
不过啊,平均数也有它的”致命伤”咱们都知道,平均数特别容易受到极端值的影响比如咱们班上有个学霸,每次考试都考150分,那就算其他同学都考100分,咱们班的平均分也会被这个学霸拉高,变成110分这时候平均数就有点”失职”了,它不能代表大多数同学的真实水平
统计学家约翰图基就曾经用过一个经典例子说明这个问题他说:”如果你走进一个酒吧,看到三个人的平均身高是6英尺,那你是不是应该赶紧离开因为那三个人的身高很可能是一个6英尺高的人,一个5英尺高的人,还有一个1英尺高的人”哈哈,这个比喻太形象了
说到这里,我必须得提一下统计学家卡尔皮尔逊他在19世纪末就发现了平均数的这个”缺点”皮尔逊是英国皇家学会会员,现代统计学的奠基人之一他发现,当数据分布偏斜时,平均数可能会严重偏离数据的中心位置所以啊,在分析偏态分布的数据时,光看平均数可不够,还得结合其他指标一起看
我最近看了一篇关于房价的研究,就充分说明了这个问题研究发现,纽约曼哈顿地区的平均房价高达120万美元,听起来是不是很吓人但实际上,这个数字被少数几栋天价豪宅拉高了去掉这些极端值后,曼哈顿地区的房价中位数只有85万美元所以啊,在看这类数据时,一定要问清楚是用平均数还是中位数计算的,否则很容易被误导
第二章:中位数的智慧——数据世界的”公平仲裁者”
第二章:中位数的智慧——数据世界的”公平仲裁者”
如果说平均数是数据世界的”老好人”,那中位数就是”公平仲裁者”中位数啊,就是将一组数据从小到大排列后,位于中间的那个数如果数据个数是偶数,那中位数就是中间两个数的平均值
中位数最大的优点就是抗干扰能力强,不受极端值的影响比如咱们班上那个150分的学霸,对班级的中位数没有任何影响如果咱们班有5个同学,成绩分别是:95、100、100、100、150,那中位数就是100分,而不是被拉高的110分
说到中位数,我必须得提一下经济学奖得主罗伯特弗兰克他在《财富与幸福》这本书里就用了中位数来说明贫富差距问题弗兰克发现,在,最富有的1%人口的收入中位数是100万美元,而最穷的50%人口的收入中位数只有2.5万美元这个对比比单纯看平均收入更能反映真实情况
中位数在商业分析中也特别有用比如某公司想了解员工的收入水平,如果平均工资是8000元,但中位数只有6000元,那就说明公司里有几个高管工资特别高,把平均工资拉上去了这时候中位数更能反映普通员工的真实收入水平
我最近看了一个关于中庭收入的调查调查发现,城镇居民家庭收入的平均数是6万元,但中位数只有4.5万元这说明收入分配比较不均衡,少数高收入家庭把平均收入拉高了如果想制定扶贫,光看平均收入肯定不够,必须结合中位数来看,才能制定出更精准的
说到这里,我必须得提一下统计学家约翰盖尔他在《统计推断》这本书里就强调了中位数在探索性数据分析中的重要性盖尔说:”中位数就像数据的’安全网’,无论数据分布多么奇怪,中位数都能提供一个合理的中心位置”这话太对了
第三章:众数的魅力——数据世界的”多数派”
第三章:众数的魅力——数据世界的”多数派”
如果说平均数是数据世界的”老好人”,中位数是”公平仲裁者”,那众数就是”多数派”众数啊,就是一组数据现次数最多的那个数比如咱们班同学的身高,如果180cm的人最多,那180cm就是这组数据的众数
众数最大的优点就是简单直观,特别适合描述分类数据比如某公司想了解最受欢迎的员工福利,可以通过统计各种福利方案的选择人数,然后找出选择人数最多的那个方案,这就是众数
说到众数,我必须得提一下社会学家欧文戈夫曼他在《日常生活中的自我呈现》这本书里就用了众数来分析人们在社会互动中的行为模式戈夫曼发现,在正式场合,人们的行为往往遵循”众数行为”,也就是大多数人会怎么做,他们就怎么做
众数在市场调研中也特别有用比如某服装公司想了解哪种尺码的裙子最受欢迎,可以通过统计销售数据,然后找出销量最多的那个尺码,这就是众数如果公司决定生产哪种尺码,众数就是最好的参考
我最近看了一个关于社交媒体使用的调查调查发现,在所有社交平台上,微信是使用人数最多的平台,有6亿用户,这就是众数虽然微博、抖音等平台用户总数更多,但使用人数最多的平台还是微信如果某公司想投放广告,光看总用户数肯定不够,还得看众数,才能找到最精准的目标用户
说到这里,我必须得提一下统计学家乔治博克斯他在《统计思想》这本书里就强调了众数在探索性数据分析中的价值博克斯说:”众数就像数据的’指南针’,无论数据多么复杂,众数都能指出最常见的情况”这话太对了
第四章:平均数、中位数和众数的关系——数据世界的”三重奏”
第四章:平均数、中位数和众数的关系——数据世界的”三重奏”
当平均数、中位数和众数在一起时,它们就像数据世界的”三重奏”,相互补充,共同揭示数据的全貌这三种指标之间的关系,往往能告诉我们很多关于数据分布的信息
如果一组数据对称分布,那平均数、中位数和众数会非常接近比如正态分布的数据,这三个指标几乎相等这时候,它们可以相互印证,提供一致的信息
但如果数据偏态分布,这三个指标就会分道扬镳在右偏态分布中,平均数大于中位数,中位数大于众数在左偏态分布中,众数大于中位数,中位数大于平均数这时候,它们就提供了不同的视角,让我们更全面地理解数据
说到这里,我必须得提一下统计学家弗朗西斯高尔顿他在19世纪就发现了数据分布的三种基本形态:对称分布、右偏态分布和左偏态分布高尔顿是达尔文表弟,也是现代心理测量的先驱他发现,在测量人类特征时,比如身高、智力等,数据分布往往接近正态分布但在某些情况下,比如收入、财富等,数据分布会右偏态
我最近看了一个关于中庭财富的调查调查发现,中庭财富的分布呈明显的右偏态,少数超级富豪把平均财富拉得很高这时候,如果只看平均财富,就会严重低估普通家庭的真实财富水平这时候,中位数和众数就提供了更真实的信息
第五章:如何选择合适的指标——数据世界的”选美比赛”
第五章:如何选择合适的指标——数据世界的”选美比赛”
当面对一组数据时,我们该如何选择合适的指标来描述它呢这就像数据世界的”选美比赛”,每个指标都有自己的优势,但也没有绝对的冠军
如果数据是对称分布的,那
