视频字幕
线性相关是统计学中的重要概念,用来衡量两个连续变量之间线性关系的强度和方向。我们用皮尔逊相关系数r来表示,它的取值范围在负一到正一之间。当r等于一时表示完美正相关,当r等于负一时表示完美负相关,当r等于零时表示没有线性关系。
线性回归是建立数学模型来描述变量间线性关系的统计方法。基本模型方程是Y等于贝塔零加贝塔一乘以X加误差项。其中Y是因变量,X是自变量,贝塔零是截距表示X等于零时Y的值,贝塔一是斜率表示X每增加一个单位Y的平均变化量,误差项代表模型无法解释的随机部分。
模型评估是回归分析的重要环节。决定系数R平方是最常用的评估指标,它等于一减去残差平方和除以总平方和。R平方的取值范围在零到一之间,表示模型解释了因变量多少比例的变异。比如R平方等于零点八表示模型解释了百分之八十的变异。在简单线性回归中,R平方等于相关系数r的平方。
多元线性回归扩展了简单回归,可以同时考虑多个自变量对因变量的影响。模型方程变为Y等于贝塔零加贝塔一乘以X一加贝塔二乘以X二加误差项。关键在于系数的解释,贝塔一表示保持X二不变时X一对Y的影响。这在实际应用中非常有用,比如房价预测可以同时考虑面积、地段和楼层等多个因素。
总结一下我们学习的关键内容。线性相关用相关系数r衡量两个变量线性关系的强度和方向。线性回归则建立数学模型来预测和解释变量间的关系。决定系数R平方评估模型的拟合效果。多元回归可以同时分析多个因素的影响。最重要的是要记住,相关不等于因果,统计关联不能直接推断因果关系。