← 返回
倾向性评分建模详解 🤔 为什么要用4种算法计算PS? 核心问题:不知道哪种方法最准确 现实情况: 医生的选择行为很复杂 可能是简单的线性关系 也可能是复杂的非线性关系 我们不知道真实的规律是什么 解决方案: 用4种不同的方法都试一遍 看哪种方法最准确 选择最好的方法 比喻: 就像用4种不同的方法预测天气,然后选择最准确的那种方法作为天气预报。 🔍 4种算法的原理 方法1:基础逻辑回归(最简单) 假设:各因素独立影响 简单打分表: 年龄每增加1岁:-2分 男性:+10分 重度高血压:-15分 例子: 30岁男性轻度:30×(-2) + 10 + 0 = -50分 70岁女性重度:70×(-2) + 0 + (-15) = -155分 方法2:加入交互项(考虑组合效应) 假设:因素之间有相互作用 现实例子: 年轻男性:医生更愿意尝试新药 年老女性:医生更保守 新打分表: 基础分 + 年龄×性别 + 年龄×疾病严重程度 方法3:加入平方项(考虑非线性) 假设:影响不是直线关系 现实例子: 30岁→40岁:医生选择变化小 60岁→70岁:医生选择变化大 新打分表: 基础分 + 年龄² + 其他平方项 方法4:XGBoost(人工智能) 假设:关系很复杂,让电脑自己找规律 电脑的思路: 自动发现复杂模式 比如:"45-55岁男性糖尿病患者"这种特殊组合 不需要人工猜测 📊 如何比较哪种算法更好? 用AUC来比较 AUC = 模型预测准确率 简单测试: 随机选择两个病人: 病人A:实际用了新药 病人B:实际用了老药 好模型应该: 病人A的预测概率 > 病人B的预测概率 具体比较例子 100对病人测试结果: 方法1(基础逻辑回归):70对猜对 → AUC = 0.70 方法2(加交互项):75对猜对 → AUC = 0.75 方法3(加平方项):80对猜对 → AUC = 0.80 方法4(XGBoost):85对猜对 → AUC = 0.85 结论: XGBoost最准确! 🎯 选出最好的算法 选择标准:AUC最高 假设结果: 基础逻辑回归:AUC = 0.72 加交互项:AUC = 0.76 加平方项:AUC = 0.78 XGBoost:AUC = 0.85 选择: XGBoost(AUC最高) 用最好的算法计算每个病人的PS 例子: 病人1:30岁男性轻度高血压 → PS = 0.75(75%概率用新药) 病人2:70岁女性重度高血压 → PS = 0.15(15%概率用新药) 🔄 核心逻辑 1. 建模医生的选择行为 收集病人特征和医生的实际选择 用4种方法预测医生选择 2. 找到最能预测医生选择的方法 比较4种方法的AUC 选择AUC最高的方法 3. 用这个方法计算每个病人的倾向性评分 用最好的模型计算PS 每个病人都有一个0-1之间的概率 4. 基于准确的评分进行公平比较 用PS进行匹配、调整或分层 确保比较的公平性 💡 一句话总结 AUC越高,说明我们越能准确预测医生为什么选择某种治疗,倾向性评分越准确,后续的效果比较越可靠。 为什么这很重要? 准确的PS → 可靠的结论 PS准确:找到真正相似的病人进行比较 PS不准:比较仍然不公平,结论不可靠 简单比喻: 就像找最准确的体重秤,只有秤准了,才能准确比较减肥效果。PS就是我们的"秤",必须先保证它准确。(讲四种算法的时候,用直观的动画来演示)
📋 信息
💬 答案
📝 字幕
视频信息
视频地址
复制
封面地址
复制
Provider
答案文本
复制
视频字幕
复制