视频字幕
我们来分析一个概率统计问题。已知32%的成年男子拥有至少一支枪,现在有300个成年男子的样本,其中120个或更多拥有枪支的事件出现概率为0.0015。我们需要解决两个问题:第一,如何计算出这个0.0015的概率?第二,这类概率在统计学中叫什么名字?
这是一个典型的二项分布问题。我们有300次独立试验,每次成功概率为0.32。随机变量X表示拥有枪支的人数,服从参数为n=300,p=0.32的二项分布。我们需要计算X大于等于120的概率。
当二项分布的参数较大时,可以用正态分布近似计算。首先检验近似条件:np和n(1-p)都大于5,条件满足。然后计算均值96和标准差8.08。将X=120标准化得到Z值约为2.97,查标准正态分布表得到概率0.0015。这类概率在统计学中称为累积概率或尾部概率。
二项分布描述了n次独立试验中成功次数的概率分布。每次试验成功概率为p,失败概率为1-p。在我们的问题中,n等于300,p等于0.32,所以X服从二项分布B(300,0.32)。二项分布的概率质量函数包含组合数和概率的幂次。当n较大时,二项分布近似正态分布,呈现钟形曲线特征。
根据中心极限定理,当n足够大时,二项分布可以用正态分布来近似。近似的条件是np大于等于5且n乘以1减p也大于等于5。在我们的问题中,np等于96,n乘以1减p等于204,都满足条件。近似的正态分布均值为np等于96,方差为np乘以1减p等于65.28,标准差约为8.08。
当用连续分布近似离散分布时,需要进行连续性修正来提高精度。由于离散随机变量X等于120对应连续分布中119.5到120.5的区间,所以计算P(X大于等于120)时应该修正为P(X大于等于119.5)。这个0.5的修正虽然看起来很小,但对提高近似计算的准确性非常重要。
现在进行具体的标准化计算。首先应用连续性修正,将X大于等于120转换为X大于等于119.5。然后使用标准化公式,Z等于X减去均值再除以标准差,即119.5减96除以8.08,约等于2.91。查标准正态分布表,P(Z大于等于2.91)约等于0.0018,这与题目给出的0.0015非常接近,差异主要来自计算和查表的精度限制。