视频字幕
概率和似然是统计学中两个密切相关但概念不同的术语。概率关注的是给定模型或参数时,某个事件发生的可能性。而似然则关注给定观测数据时,不同参数解释这些数据的合理性程度。简单来说,概率是从模型推导数据,似然是从数据反推模型。
概率的定义是给定模型或参数时,某个事件发生的可能性。它的数学表示为P(事件|参数),其中参数是固定的,事件是变量。概率的方向是从模型推导数据,具有归一化特性,即所有可能事件的概率之和等于1。以抛硬币为例,如果硬币是均匀的,参数p等于0.5,那么正面和反面的概率都是0.5。
似然的定义是给定观测数据时,不同参数解释这些数据的合理性程度。它的数学表示为L(参数|数据),等于P(数据|参数),但这里参数是变量,数据是固定的。似然的方向是从数据反推模型,不要求归一化。例如,观测到10次抛硬币中7次正面,我们可以计算不同p值的似然:p等于0.5时似然为0.12,p等于0.7时似然为0.27,p等于0.9时似然为0.06。
现在我们来对比概率和似然的核心区别。在关注点上,概率关注事件发生的可能性,而似然关注参数解释数据的合理性。在变量方面,概率中事件是变量参数固定,似然中参数是变量数据固定。在方向上,概率是从模型推导数据,似然是从数据反推模型。左边展示概率:给定p等于0.5,正面概率是0.5。右边展示似然:给定7次正面数据,p等于0.7时似然最大。
让我们通过一个具体例子来理解概率和似然的区别。抛硬币10次观察到7次正面。概率问题是:如果硬币均匀,得到7次正面的概率是多少?答案是0.117。似然问题是:观察到7次正面后,哪个p值最能解释这个结果?通过最大似然估计,我们得到p等于0.7。总结来说,概率用于预测未来事件,似然用于从观测数据推断参数。这就是概率和似然的本质区别。