视频字幕
离散型随机变量不能严格地服从正态分布。离散型变量只能取有限个或可数无限个值,比如抛硬币的次数或车辆数量。而正态分布是连续型分布,其取值可以是连续区间内的任意值,比如身高或重量。图中蓝色曲线表示连续的正态分布,红色点表示离散变量的取值。
今天我们来讨论一个重要概念:离散型随机变量与正态分布的关系。首先要明确的是,离散型随机变量不能严格服从正态分布。这是因为正态分布是连续分布,而离散变量只能取有限个或可数无限个值。然而,在某些条件下,我们可以用正态分布来近似离散型随机变量的分布。
虽然离散变量不能严格服从正态分布,但在特定条件下可以用正态分布来近似。当离散变量的取值非常多,且其概率分布的形状类似钟形曲线时,就可以进行正态近似。常见的例子包括二项分布当试验次数n很大时,以及泊松分布当均值λ很大时。这种近似的理论依据是中心极限定理。
在实际应用中,正态近似有具体的条件。对于二项分布,当np大于等于5且n乘以1减p也大于等于5时,可以使用正态近似。对于泊松分布,当参数λ大于等于10时,正态近似效果良好。由于我们用连续分布来近似离散分布,需要进行连续性修正,即加减0.5。这样可以使近似更加准确。
在使用正态分布近似离散分布时,需要进行连续性修正。这是因为离散变量计算的是某个特定值的概率,而连续变量计算的是某个区间的概率。修正方法是将离散变量等于k的概率,近似为连续变量在k减0.5到k加0.5区间内的概率。图中黄色条表示离散概率,绿色区域表示连续性修正后的区间概率。这种修正可以显著提高近似的精度。
中心极限定理是理解正态近似的关键。该定理指出,当我们有独立同分布的随机变量序列时,无论原始分布是什么形状,样本均值的分布都会趋向于正态分布,只要样本量足够大。这解释了为什么许多离散分布可以用正态分布来近似。图中展示了从均匀分布开始,随着样本量增加,样本均值的分布逐渐接近正态分布的过程。
让我们总结一下今天学习的内容。首先,离散型随机变量不能严格服从正态分布,但在特定条件下可以用正态分布来近似。对于二项分布,当np大于等于5且n乘以1减p也大于等于5时可以近似;对于泊松分布,当λ大于等于10时可以近似。使用连续性修正可以提高近似精度。这种近似的理论基础是中心极限定理。正态近似在统计推断、质量控制等领域有广泛应用,是统计学中的重要工具。