视频字幕
正態分佈是一種連續概率分佈,其概率密度函數曲線呈鐘形。這個分佈由兩個參數決定:均值μ和標準差σ。均值決定了分佈的中心位置,標準差決定了分佈的寬窄。藍色曲線是標準正態分佈,其均值為0,標準差為1。紅色曲線的標準差較小,所以曲線更窄更高。綠色曲線的均值向右偏移,所以整個曲線向右移動。
正態分佈有幾個重要特性。首先,它是對稱的,曲線關於均值μ對稱。其次,均值、中位數和眾數都相等。第三,曲線的兩端無限接近橫軸但永不相交。最重要的是68-95-99.7法則,也稱為經驗法則:約68%的數據落在均值正負1個標準差範圍內,約95%的數據落在均值正負2個標準差範圍內,約99.7%的數據落在均值正負3個標準差範圍內。這個法則在統計學和數據分析中非常有用。
標準正態分佈是均值為0,標準差為1的特殊正態分佈。我們可以通過Z分數將任何正態分佈轉換為標準正態分佈。Z分數的計算公式是Z等於X減去均值μ再除以標準差σ。Z分數表示原始數據偏離均值多少個標準差。例如,如果一個數據點的Z分數為2,表示它比均值高出2個標準差。在這個例子中,我們有一個均值為3,標準差為1.5的正態分佈,當X等於6時,計算得到的Z分數為2,表示這個數據點比均值高出2個標準差。這種標準化使我們能夠比較不同正態分佈中的數據。
中央極限定理是統計學中最重要的定理之一。它指出,當樣本量足夠大時,樣本均值的分佈近似服從正態分佈,無論原始總體的分佈形態如何。這個定理有兩個重要特性:首先,樣本均值的期望值等於總體均值;其次,樣本均值的標準差等於總體標準差除以樣本量的平方根。在這個例子中,我們從一個均勻分佈的總體開始,當我們增加樣本量時,樣本均值的分佈逐漸變得更像正態分佈。當樣本量達到30時,分佈已經非常接近正態分佈。中央極限定理是統計推斷的基礎,使我們能夠對各種總體進行參數估計和假設檢驗。
正態分佈在許多領域都有廣泛應用。首先,它描述了許多自然現象,如人類的身高、體重和智商等生物特徵。其次,在科學實驗和測量中,隨機誤差通常呈正態分佈。第三,正態分佈是統計推斷的基礎,用於假設檢驗、置信區間和回歸分析。第四,在金融和風險管理領域,正態分佈用於分析股票回報、期權定價和風險評估。最後,在製造業的品質控制中,正態分佈用於監控產品質量的變異。正態分佈之所以如此重要,是因為它不僅描述了自然界中的許多現象,還為我們提供了強大的數學工具來分析和預測這些現象。