视频字幕
我们来看这个统计问题。五个人的工资分别是2千元、3千元、4千元、5千元和5万元。注意到最后一个工资远高于其他四个,这是一个异常值。我们需要选择最能代表这组数据平均收入水平的统计量。
让我们计算平均数。五个工资的总和是64,000元,除以5得到平均数12,800元。但是观察数据,只有最后一个人的工资超过这个平均数,其他四个人的工资都远低于12,800元。这说明平均数被那个异常高的工资拉高了,不能很好地代表大多数人的收入水平。
现在我们计算中位数。将五个工资按从小到大排序:2千、3千、4千、5千、5万元。中位数是位于中间位置的数,也就是第3个数,即4千元。与平均数12,800元相比,中位数4千元更接近大多数人的实际收入水平,因为它不受那个异常高工资的影响。
让我们分析其他选项。标准差是衡量数据分散程度的指标,不是用来表示平均水平的。众数是出现次数最多的数值,但这组数据中每个数都只出现一次,所以没有众数。通过比较可以看出,当数据中存在异常值时,中位数比平均数更能代表数据的典型水平。因此正确答案是b中位数。
总结一下,当数据中存在异常值时,中位数比平均数更能代表数据的典型水平。在这个问题中,5万元的工资是一个明显的异常值,它使平均数达到12,800元,远高于大多数人的收入。而中位数4,000元更接近大多数人的实际收入水平,因为它不受极端值的影响。所以正确答案是b中位数。