视频字幕
正态分布,也称为高斯分布,是一种重要的连续概率分布。它的概率密度函数曲线呈钟形,并且关于均值对称。正态分布完全由两个参数决定:均值μ和标准差σ。均值决定了分布的中心位置,而标准差则决定了分布的宽窄程度。这个公式是正态分布的概率密度函数,看起来可能有些复杂,但它描述了正态分布的精确形状。
标准差σ是决定正态分布形状的关键参数。当标准差较小时,正态分布曲线变得又窄又高,表示数据更集中在均值附近。而当标准差较大时,曲线变得宽而矮,表示数据分布更加分散。让我们看看当标准差从小变大时,正态分布曲线的变化。无论标准差如何变化,曲线下的总面积始终保持为1,这表示所有可能结果的总概率为100%。
均值μ决定了正态分布曲线的位置。当均值增大时,整个分布曲线向右移动;当均值减小时,曲线向左移动。均值是分布的中心点,也是概率密度函数的最高点和分布的对称轴。让我们观察当均值从0变化到正值和负值时,正态分布曲线如何移动。注意,无论均值如何变化,曲线的形状保持不变,只是位置发生了变化。
标准正态分布是均值为0,标准差为1的特殊正态分布。在正态分布中,有一个非常重要的统计规律,称为68-95-99.7法则,也叫经验法则。这个法则告诉我们:约68%的数据落在均值左右一个标准差的范围内,约95%的数据落在均值左右两个标准差的范围内,约99.7%的数据落在均值左右三个标准差的范围内。这个法则在统计学和数据分析中有着广泛的应用,它帮助我们理解数据的分布情况,并对异常值进行判断。
正态分布在现实生活中有着广泛的应用。许多自然现象如人类的身高、体重和智商等特征都近似服从正态分布。在科学实验和工业生产中,测量误差通常也服从正态分布。金融市场中的资产收益率分析、工业生产中的质量控制也常常应用正态分布理论。这里我们展示了人群身高数据的分布,可以看到它非常接近正态分布曲线。正态分布之所以如此普遍,部分原因是中心极限定理:大量独立随机变量的和趋向于正态分布,无论这些变量本身的分布如何。这使得正态分布成为统计学和概率论中最重要的概率分布之一。