视频字幕
正态分布是统计学中最重要的连续概率分布之一,又称为高斯分布。它以德国数学家高斯的名字命名。正态分布在自然界和社会现象中广泛存在,比如人的身高、体重、考试成绩等都近似服从正态分布。正态分布的图形呈现出对称的钟形曲线,这是它最显著的特征。
正态分布的概率密度函数是一个复杂但优美的数学表达式。公式中,μ表示均值或期望值,决定了分布的中心位置;σ表示标准差,决定了分布的离散程度;π是圆周率,e是自然常数。这个公式的核心是指数函数的负二次方形式,正是这种形式创造了对称的钟形曲线。分母中的标准化因子确保了整个曲线下的面积等于1。
正态分布的形状完全由两个参数决定:均值μ和标准差σ。均值μ决定分布的中心位置,当μ改变时,整个曲线会沿着x轴左右平移,但形状保持不变。标准差σ决定分布的离散程度,σ越大,曲线越宽越矮,数据越分散;σ越小,曲线越窄越高,数据越集中。通过调整这两个参数,我们可以描述各种不同的正态分布。
标准正态分布是一种特殊的正态分布,其均值为0,标准差为1。通过标准化变换公式Z等于X减去μ再除以σ,我们可以将任意正态分布转换为标准正态分布。这个变换过程相当于将原分布进行平移和缩放,使其中心移到原点,标准差变为1。标准化后的分布保持了原有的概率关系,这使得我们可以用统一的标准正态分布表来计算各种概率问题。
68-95-99.7法则是正态分布中的一个重要经验法则。它告诉我们:约68%的数据落在均值加减一个标准差的范围内,约95%的数据落在均值加减两个标准差的范围内,约99.7%的数据落在均值加减三个标准差的范围内。这个法则非常实用,帮助我们快速估计数据的分布情况,判断某个数值是否异常。