出于以下两个原因,需要使用专门的方法来分析生存数据:
1. 生存时间通常具有专门的非正态分布,如指数、Weibull 和对数正态。
2. 一些数据可能是删失的。
将非参数 Kaplan-Meier 方法用于一组或多组完整或右删失数据来计算生存函数。完整数据没有删失值。右删失是指您不知道精确的生存时间但是知道它大于指定的值。当研究结束但并非所有单元都发生故障或者在完成研究前患者必须退出研究时,就会发生右删失。若不在分析中引入偏倚,将无法忽略删失的观测。生存模型的元素包括:
• 一个时间,指示还要多长时间单元(或患者)才会经历事件或删失。时间是模型响应 (Y)。
• 一个指示符,表示观测值是经历了事件还是删失的。JMP 使用以下约定:删失单元的代码为 1,非删失事件的代码为 0。
• 解释变量(若使用回归模型)。
• 区间删失是指数据点位于两个值构成的区间中的情形。若需要区间删失,则两个 Y 变量指定界定事件时间的上限和下限。
用于可靠性和生存数据的常见术语包括:寿命、生存、失效时间、事件时间和持续时间。
“生存”平台计算一个或多个组的乘积限 (Kaplan-Meier) 生存函数估计值。可将其用作完整分析或用作探索性分析,以便获取关于更复杂的模型拟合的信息。“Kaplan-Meier 生存”平台完成以下工作:
• 显示每个组的估计生存函数图。整个样本的估计生存函数图是可选项。
• 计算并列出每个组以及合并样本的生存函数估计值。
• 显示指数、Weibull 和对数正态诊断失效图,以图形方式检查使用这些分布是否适合进行进一步的回归建模。一经要求便可得到参数估计值。
• 计算对数秩和广义 Wilcoxon 卡方统计量,以在不同组之间进行估计的生存函数的齐性检验。
• 分析竞争原因、提示失效原因变量,并为对应于每个原因的删失模式估计 Weibull 失效时间分布。