视频字幕
某地质探测队要探测矿中金属锂的分布情况。他们设置了1个原点,并确定了5个采样点,这些采样点到原点的距离分别为1、2、3、4、5个单位。通过测量得到各采样点的金属锂含量数据,并计算出了一系列统计量,包括含量总和、协方差、对数变换后的统计量等。我们需要利用这些数据建立合适的回归模型。
为了选择更合适的回归模型,我们需要计算两种模型的相关系数。首先计算基本统计量:x的平均值为3,y的平均值为12.4。然后分别计算线性模型y等于a加bx和对数模型y等于a加b乘以ln x的相关系数。通过比较相关系数的绝对值大小来判断哪个模型更适合。
通过比较可以发现,由于两个模型中y的方差相同,我们主要比较分子和分母的比值。计算结果显示,对数模型的相关系数绝对值约为15.25除以根号下y的方差,而线性模型约为14.87除以根号下y的方差。由于对数模型的比值更大,说明对数模型y等于a加b乘以ln x具有更强的相关性,因此应该选择对数模型作为经验回归模型。
现在建立对数回归方程。设回归方程为y等于a加b乘以ln x。首先计算回归系数b,等于u和y的协方差除以u的方差,即19.38除以1.615等于12。然后计算截距a,等于y的平均值减去b乘以u的平均值,即12.4减去12乘以0.958等于0.904。因此最终的经验回归方程为:y等于0.904加12倍的ln x。
现在我们来计算基本统计量。首先计算x的平均值,等于1加2加3加4加5的和除以5,结果是3。y的平均值等于62除以5,结果是12.4。u的平均值等于4.79除以5,约等于0.958。接下来计算方差,x的方差为10,u的方差约为1.615。这些基本统计量为后续的相关系数计算奠定了基础。
相关系数是衡量两个变量线性相关程度的统计量。其计算公式为协方差除以两个变量标准差的乘积。相关系数的取值范围在负1到正1之间。当r大于0时表示正相关,小于0时表示负相关。相关系数的绝对值越大,说明两个变量的线性相关性越强。我们将利用这个理论来比较两种回归模型的适用性。