视频字幕
倾向性评分建模中,我们面临一个核心问题:不知道哪种建模方法最准确。医生的治疗选择行为非常复杂,可能是简单的线性关系,也可能是复杂的非线性关系。我们不知道真实的规律是什么。解决方案是用4种不同的算法都试一遍,比较哪种方法预测医生选择最准确,然后选择最好的方法。这就像气象台用4种不同的方法预测天气,然后选择最准确的那种方法作为最终的天气预报。
第一种方法是基础逻辑回归,这是最简单的方法。它假设各个因素独立影响医生的选择。我们给每个因素一个固定的分数,比如年龄每增加1岁减2分,男性加10分,重度高血压减15分。举个例子,30岁男性轻度高血压患者的分数是30乘以负2加10加0等于负50分。70岁女性重度高血压患者的分数是70乘以负2加0减15等于负155分。分数越低,医生选择新药的概率越小。
第二种方法是加入交互项,考虑因素之间的相互作用。比如年轻男性,医生可能更愿意尝试新药,而年老女性,医生可能更保守。第三种方法是加入平方项,考虑非线性关系。比如从30岁到40岁,医生选择变化不大,但从60岁到70岁,变化就很大。这样我们的打分表就变成了基础分加上年龄乘以性别,再加上年龄的平方项。图中蓝线表示简单的线性关系,红线表示非线性关系,绿点表示交互效应的影响。
我们用AUC来比较四种算法的准确性。AUC是模型预测准确率的指标,值在0.5到1之间,AUC越高,模型越好。测试结果显示:基础逻辑回归的AUC是0.70,加交互项的AUC是0.75,加平方项的AUC是0.78,而XGBoost的AUC达到了0.85。从柱状图可以清楚看到,XGBoost的表现最好,因此我们选择XGBoost作为最终的建模方法来计算倾向性评分。