视频字幕
正态分布是统计学中最重要的连续概率分布之一。它的概率密度函数曲线呈现出优美的钟形,完全对称于均值。这种分布在自然界和社会科学中广泛存在,是许多统计方法的基础。
正态分布完全由两个参数决定:均值μ和标准差σ。均值μ决定了分布的中心位置,即钟形曲线的对称轴。标准差σ决定了分布的宽度,σ越大,曲线越宽越平;σ越小,曲线越窄越高。我们用N(μ,σ²)来表示均值为μ、方差为σ²的正态分布。
正态分布有一个重要的性质,称为68-95-99.7法则。这个法则告诉我们:约68%的数据落在均值加减一个标准差的范围内,约95%的数据落在均值加减两个标准差的范围内,约99.7%的数据落在均值加减三个标准差的范围内。这个法则在统计推断和质量控制中有重要应用。
标准正态分布是均值为0、标准差为1的特殊正态分布,记作N(0,1)。任何正态分布都可以通过标准化公式转换为标准正态分布。标准化公式是Z等于X减去均值再除以标准差。这种标准化使得我们可以使用统一的标准正态分布表来计算各种正态分布的概率,大大简化了计算过程。
正态分布在现实生活中有着极其广泛的应用。人的身高、体重等生物特征通常服从正态分布;科学实验中的测量误差也遵循正态分布;金融市场的收益率、工业生产中的质量控制、教育测试的分数分布等都可以用正态分布来描述。更重要的是,中心极限定理告诉我们,大量独立随机变量的平均值趋向于正态分布,这使得正态分布成为统计学的核心基础。