倾向性评分建模详解 🤔 为什么要用4种算法计算PS？核心问题：不知道哪种方法最准确现实情况：医生的选择行为很复杂可能是简单的线性关系也可能是复杂的非线性关系我们不知道真实的规律是什么解决方案：用4种不同的方法都试一遍看哪种方法最准确选择最好的方法比喻：就像用4种不同的方法预测天气，然后选择最准确的那种方法作为天气预报。 🔍 4种算法的原理方法1：基础逻辑回归（最简单）假设：各因素独立影响简单打分表：年龄每增加1岁：-2分男性：+10分重度高血压：-15分例子： 30岁男性轻度：30×(-2) + 10 + 0 = -50分 70岁女性重度：70×(-2) + 0 + (-15) = -155分方法2：加入交互项（考虑组合效应）假设：因素之间有相互作用现实例子：年轻男性：医生更愿意尝试新药年老女性：医生更保守新打分表：基础分 + 年龄×性别 + 年龄×疾病严重程度方法3：加入平方项（考虑非线性）假设：影响不是直线关系现实例子： 30岁→40岁：医生选择变化小 60岁→70岁：医生选择变化大新打分表：基础分 + 年龄² + 其他平方项方法4：XGBoost（人工智能）假设：关系很复杂，让电脑自己找规律电脑的思路：自动发现复杂模式比如："45-55岁男性糖尿病患者"这种特殊组合不需要人工猜测 📊 如何比较哪种算法更好？用AUC来比较 AUC = 模型预测准确率简单测试：随机选择两个病人：病人A：实际用了新药病人B：实际用了老药好模型应该：病人A的预测概率 > 病人B的预测概率具体比较例子 100对病人测试结果：方法1（基础逻辑回归）：70对猜对 → AUC = 0.70 方法2（加交互项）：75对猜对 → AUC = 0.75 方法3（加平方项）：80对猜对 → AUC = 0.80 方法4（XGBoost）：85对猜对 → AUC = 0.85 结论： XGBoost最准确！ 🎯 选出最好的算法选择标准：AUC最高假设结果：基础逻辑回归：AUC = 0.72 加交互项：AUC = 0.76 加平方项：AUC = 0.78 XGBoost：AUC = 0.85 选择： XGBoost（AUC最高）用最好的算法计算每个病人的PS 例子：病人1：30岁男性轻度高血压 → PS = 0.75（75%概率用新药）病人2：70岁女性重度高血压 → PS = 0.15（15%概率用新药） 🔄 核心逻辑 1. 建模医生的选择行为收集病人特征和医生的实际选择用4种方法预测医生选择 2. 找到最能预测医生选择的方法比较4种方法的AUC 选择AUC最高的方法 3. 用这个方法计算每个病人的倾向性评分用最好的模型计算PS 每个病人都有一个0-1之间的概率 4. 基于准确的评分进行公平比较用PS进行匹配、调整或分层确保比较的公平性 💡 一句话总结 AUC越高，说明我们越能准确预测医生为什么选择某种治疗，倾向性评分越准确，后续的效果比较越可靠。为什么这很重要？准确的PS → 可靠的结论 PS准确：找到真正相似的病人进行比较 PS不准：比较仍然不公平，结论不可靠简单比喻：就像找最准确的体重秤，只有秤准了，才能准确比较减肥效果。PS就是我们的"秤"，必须先保证它准确。（讲四种算法的时候，用直观的动画来演示）

视频地址

封面地址

Provider