当前位置:首页 > 生存分析及COX回归
第十二章 生存分析及COX回归
在临床医学中, 对病人治疗效果的考查. 一方面可以看治疗结局的好坏,另一方面还可以通过治疗时间的长短来衡量。 例如某种疾病治愈的时间, 某癌症病人手术后的存活时间等, 把这类与时间有关的资料统称为生存资料。生存资料一般通过随访收集,从某标准时刻(发病、手术或出院等)开始,按某种相等或不等时间间隔,对观察对象定期观察预定项目所得的资料,它的结局是死亡,治愈、复发、阳性等。但在临床上,往往由于各种原因:(1)因迁移原因失去联系;(2)死于其他原因而造成失访;(3)预定终止结果迟迟不发生,致使在一定时期内,一部分病例得不到确切的生存期,但它们提供了其生存期长于观察期的信息,这种数据称为删失数据,也称截尾数据或终检值(censored data),包含终检值的数据即为不完全数据。处理这类数据的统计分析方法称为生存分析。它包括三个方面的内容1)生存过程的描述,主要是生存率的估计;2)生存过程的比较;3)影响因素的分析。
§12.1 生存率的估计
生存率估计常用的有两种方法 乘积极限法和寿命表法。 1 乘积极限法
又称Kaplan-Meier 法 适用于小样本资料。基本思想:将生存时间由小到大依次排列,在每个死亡点上,计算其期初人数、死亡人数、死亡概率、生存概率和生存率。
CHISS实现:点击 重复测量→生存分析→乘积极限法 应用举例:
+++
例12-1 某疗法治疗白血病后的存活月数为: 2,13,7,11,6,1,11,3,17,7。 试估计其生存率。 带“+”为存活终检值。
解步骤:1 进入数据模块 此数据库已建立在CHISS\\data文件夹中,文件名为:a9_0生存分析.DBF。打开数据库
点击 数据→文件→打开数据库表
找到文件名为:a9_0生存分析.DBF →确认
2 进入统计模块 进行统计计算
点击 重复测量→生存分析→乘积极限法
时间变量: time 终检值指标:censor→确认 3 进入结果模块 查看结果
点击 结果
乘积限估计法生存分析, 数据来自文件: C:\\CHISS\\Data\\a9_0生存分析.DBF 数据过滤条件:
80
━━━━━━━━━━━━━━━━━━━ 秩 观察 死亡 观察 生存率 次 时间 序号 数 生存率 标准误 (i) t(i) (j) n(i) S(j) Ss(j) ─────────────────── 0 0 0 10 1.0000 ... 1, 1 1 10 0.9000 0.0949 2, 2+ ... 9 ... ... 3, 3 2 8 0.7875 0.1340 4, 6 3 7 0.6750 0.1551 5, 7 4 6 0.5625 0.1651 6, 7+ ... 5 ... ... 7, 11 5 4 0.4219 0.1737 8, 11+ ... 3 ... ... 9, 13 6 2 0.2109 0.1726 10, 17 7 1 0.0000 ... ━━━━━━━━━━━━━━━━━━━ 注:删失数据为1。
平均生存期= 9.7750 标准差= 2.2664
§12.2 时序检验(log rank test)
用于比较两个或多个样本生存期,即对各样本不同时点生存率的综合分析。其原理是计算出不同时期两种疗法的观察人数和死亡人数,并由此根据两种疗法疗效相同的假设计算出两种疗法在该日期的理论死亡数,若无效假设是对的,则实际值和理论值不会相差很大,如
2
相差过大,则不象仅仅由于机遇所产生的差异,对此可作?检验以推断。
CHISS实现:点击 重复测量→生存分析→时序检验 例12-2 两种疗法治疗白血病后的存活月数如下:
+++
对照组: 2,13,7,11,6,1,11,3,17,7
++++++++
中药组: 10,2,12,13,18,6,19,26,9,8,6,43,9,4,31,24
带“+”为终检值 试分析两种疗法治疗的生存期有无差别
解步骤:1 进入数据模块 此数据库已建立在CHISS\\data文件夹中,文件名为:a9_1生存分析(小样本).DBF。打开数据库
点击 数据→文件→打开数据库表
找到文件名为:a9_1生存分析(小样本).DBF →确认 2 进入统计模块 进行统计计算 点击 重复测量→生存分析→时序检验
时间变量: time 终检值指标:censor 分组因素:g →确认
3 进入结果模块 查看结果 点击 结果
小样本时序检验(生存期比较, 处理分组为g数据来自文件: \生存分析(小样本).DBF\
81
━━━━━━━━━━━━━━━━━━━━━━━ 观察时间 期初观察数 发 理论发生数 ──── ────── 生 ────── 1 2 1 2 小计 数 1 2 ─────────────────────── 1 ... 10 16 26 1 0.385 0.615 2+ 2+ 9 16 25 0 3 ... 8 15 23 1 0.348 0.652 ... 4 7 15 22 1 0.318 0.682 6 ... 7 14 21 1 0.333 0.667 ... 6+ 6 14 20 0 7 ... 6 12 18 1 0.333 0.667 7+ ... 5 12 17 0 ... 8+ 4 12 16 0 ... 9 4 11 15 1 0.267 0.733 ... 9+ 4 10 14 0 ... 10 4 9 13 1 0.308 0.692 11 ... 4 8 12 1 0.333 0.667 11+ ... 3 8 11 0 ... 12+ 2 8 10 0 13 13 2 7 9 2 0.444 1.556 17 ... 1 6 7 1 0.143 0.857 ... 18 0 6 6 1 0.000 1.000 ... 19+ 0 5 5 0 ... 24 0 4 4 1 0.000 1.000 ... 26 0 3 3 1 0.000 1.000 ... 31 0 2 2 1 0.000 1.000 ... 43+ 0 1 1 0 ━━━━━━━━━━━━━━━━━━━━━━━ 注:删失数据为1。
实际发生数与期望发生数
━━━━━━━━━━━━━━━━━━━━ 组别 总例数 删失数 实际发生 理论发生 ──────────────────── g.1 10 3 7 3.21 g.2 16 8 8 11.79 ━━━━━━━━━━━━━━━━━━━━
Log-Rank检验,QPH = 5.683 自由度 =1 P =0.0171 说明两种疗法治疗的生存期差别有显著性。
82
§12.3 COX比例风险模型
生存时间的长短不仅与治疗措施有关, 还可能与病人的体质, 年龄, 病情的轻重等多种因素有关, 把这类因素称为伴随变量或协变量。由于失访、试验终止、意外事故、改变治疗方案等原因造成某些数据观察不完全,这些数据称为删失数据。 这种数据显然不服从正态分布和方差齐性, 不能用多元线性回归分析。 1972年英国统计学家Cox DR. 提出了一种能处理多因素生存分析数据的比例危险模型 ( Cox's proportional harzard model)。
Cox回归模型: 在p个危险因素同时影响生存过程的情况下, 在时点t的危险率模型为:
H(t)=h0(t)exp(b1x1+b2x2+?.b pxp)
其中h(t)-- 表示在时点t的死亡率;
h0(t)--表示在时点t的基本死亡率; 即不存在x1~xp因素影响时的死亡率; ?1--回归系数, 其意义是: 当因素x1每改变一个测量单位时所引起的相对危险度的自
然对数改变量即RR?exp(?11)。 若x1对生存无影响, 则理论上?1=0。
例12-3 现有50例急性淋巴细胞性白血病病人的随访记录. 在入院治疗时, 测得外周血中白细胞数x1和浸润淋巴结等级x2,经过治疗达到完全缓解后, 有的病人有巩固治疗有的没有x3, 并随访取得每例病人的生存时间的资料如下。
50例急性淋巴细胞性白血病病人的随访记录
病例号 X1 X2 X3 T(月) 病例号 X1 X2 X3 T(月)
1 2.5 0 0 3.40 26 4.7 0 0 11.00 2 1.2 2 0 3.73 27 6.0 0 0 11.77 3 173.0 2 0 3.73 28 128.0 2 1 11.83 4 3.5 0 0 3.83 29 3.5 0 1 11.83 5 119.0 2 0 4.00 30 35.0 0 0 11.97 6 39.7 0 0 4.03 31 62.2 0 0 13.16 7 10.0 2 0 4.17 32 2.0 0 0 14.83 8 62.4 0 0 4.20 33 10.8 0 1 15.17 9 502.2 2 0 4.20 34 8.5 0 1 18.23 10 2.4 0 0 5.00 35 21.6 0 1 18.23 11 4.0 0 0 5.27 36 2.0 2 1 19.16+ 12 34.7 0 0 5.67 37 2.0 0 1 20.17+ 13 14.4 0 1 7.07 38 2.0 0 1 20.17+ 14 28.4 2 0 7.26 39 3.4 2 1 20.17+ 15 2.0 2 0 7.33 40 4.3 0 1 20.57 16 0.9 0 1 7.53 41 5.1 0 1 21.00 17 40.0 2 0 7.53 42 244.8 2 1 21.87 18 30.6 2 0 7.60 43 2.4 0 0 23.77 19 6.6 0 0 7.67 44 4.0 0 1 26.00 20 5.8 0 1 7.67 45 1.7 0 1 28.33 21 21.4 2 1 8.30 46 5.1 0 1 31.33
83
22 6.1 0 1 8.33 47 1.1 0 1 37.77 23 2.8 0 0 8.33 48 32.0 0 1 66.83 24 2.7 2 1 8.80 49 12.8 0 1 73.57 25 2.5 0 0 9.23 50 1.4 0 1 124.17+ 表中“+”代表仍存活, X1代表白细胞数(千个/mm3), X2代表浸润淋巴结程度,分为0、1、2三级, X3代表是否有巩固治疗,1为有, 0为无。试进行COX回归分析。
解步骤:1 进入数据模块 此数据库已建立在CHISS\\data文件夹中,文件名为:a9_3cox模型.DBF。打开数据库
点击 数据→文件→打开数据库表
找到文件名为:a9_3cox模型.DBF →确认
2 进入统计模块 进行统计计算 点击 模型→数学模型→COX模型 解释变量 x1,x2,x3 反应变量: time
删失标记变量:CENSOR→确认
3 进入结果模块 查看结果
点击 结果
Cox 模型的估计参数(生存时间=TIME, 删失标记=CENSOR, 数据来自:C:\\CHISS\\Data\\a9_3cox模型.DBF)
━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━ 参数名 估计值 标准误 u值 p值 RR 95%CI ──────────────────────────────── X1 0.001 0.002 0.591 0.5543 1.00 0.997~1.005 X2 0.456 0.206 2.211 0.0270 1.58 1.053~2.364 X3 -1.885 0.376 5.008 0.0000 0.15 0.073~0.317 ━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━ G(卡方)= 244.7115 自由度=3 p值=0.0000。
Cox分析知,变量X2和X3有显著性意义, X1不显著。 从相对危险度来看, 巩固治疗是减少相对危险度, 提高生存时间的主要因素。浸润淋巴结的存在对于延长生存时间是不利因素, 而白细胞的个数对生存时间的影响无显著性。
*§12.4 半数效量
半数效量(ED50)是试验因素引起试验动物总体中半数产生某种反应时所需的剂量。试验因素有药物、放射物、电流强度、持续时间等。若反应用死亡、耐受来标志,则称为半数致死量、半数耐受量。它们在药理学及毒理学中有广泛的应用。
84
共分享92篇相关文档