视频字幕
t分布是统计学中的重要概率分布,由英国统计学家威廉·戈塞特在1908年提出。当我们面临小样本且总体方差未知的情况时,t分布比正态分布更适合进行统计推断。从图中可以看出,t分布呈钟形对称,但尾部比标准正态分布更厚,这使得它在处理小样本数据时更加稳健。
t分布的概率密度函数包含伽马函数,其中自由度参数ν是关键。当自由度为1时,分布尾部很厚;随着自由度增加,分布逐渐接近标准正态分布。伽马函数确保了概率密度函数的归一化性质。
t分布具有重要的统计性质。它是对称分布,均值为零。当自由度大于2时,方差等于ν除以ν减2,总是大于1。随着自由度增加,方差逐渐接近1,分布形状越来越接近标准正态分布。绿色虚线显示了方差对应的标准差范围。
t分布与正态分布的主要区别在于尾部厚度和适用条件。t分布的尾部更厚,意味着极端值出现的概率更大,这在小样本情况下更符合实际。当自由度增加时,t分布逐渐收敛到标准正态分布。黄色区域突出显示了t分布尾部比正态分布厚的特点。
t分布在统计推断中有广泛应用。最常见的是t检验,用于检验样本均值是否等于假设值。检验统计量的公式是样本均值减去假设均值,除以标准误差。图中显示了双侧检验的临界区域,红色区域为拒绝域,绿色区域为接受域。当计算的t值落在拒绝域时,我们拒绝原假设。