分布
当您从特质菜单中选择广义回归时,将显示分布选项。您可以在此处指定 Y 的分布。缩写形式 ZI 表示零泛滥。根据响应将分布分为三个类别:连续、离散和零泛滥。在下面介绍了这些选项。
连续
Y 服从均值为 μ 且标准差为 σ 的正态分布。 正态分布是对称的,若样本足够大,很多其他分布可以使用中心极限定理将其近似为正态分布。μ 的连结函数是恒等。即,Y 的均值表示为线性模型。
正态分布的尺度参数为 σ。若估计方法中无罚值,则尺度参数 σ 的估计值为均方根误差 (RMSE)。RMSE 是 σ2 的通常无偏估计量的平方根。除非涉及删失观测,否则所显示的结果等同于标准最小二乘拟合。
Y 服从位置参数为 μ 的对数正态分布。对数正态分布是向右偏斜的,通常用于对寿命或事件发生前的时间建模。 σ 的 Cauchy 分布。 Cauchy 分布具有未定义的均值和标准差。中位数和众数都是 μ。 大多数数据本质上不服从 Cauchy 分布,但它对包含大比例离群值(高达 50%)的数据执行稳健回归很有用。μ 的连结函数是恒等。请参见分布的统计详细信息
Y 服从均值参数为 μ 的指数分布。指数分布是向右偏斜的,通常用于对寿命或两个相继事件之间的时间建模。μ 的连结函数为对数。请参见分布的统计详细信息
Y 服从均值参数为 μ 且离散参数为 σ 的 gamma 分布。 gamma 分布很灵活,它包含一系列其他广泛使用的分布。例如,指数分布是 gamma 分布的特例,其中 σ = μ. 。Weibull 和卡方分布也可以从 gamma 分布导出。μ 的连结函数为对数。请参见分布的统计详细信息
Y 服从均值参数为 μ 且尺度参数为 σ 的 Weibull 分布。Weibull 分布较为灵活,经常用于对寿命或事件发生前的时间建模。μ 的连结函数是恒等。请参见分布的统计详细信息
Y 服从均值参数为 μ 且尺度参数为 σ 的对数正态分布。对数正态分布是向右偏斜的,通常用于对寿命或事件发生前的时间建模。μ 的连结函数是恒等。请参见分布的统计详细信息
Y 服从均值参数为 μ 且离散参数为 σ 的 beta 分布。 beta 的响应介于 0 到 1 之间(不包括 0 和 1),通常用于比例或比率建模。μ 的连结函数为 Logit。请参见分布的统计详细信息
离散
Y 服从参数为 p n 的二项分布。响应 Y 指示所有试验中具有固定概率 pn 个独立试验中的总成功次数。该分布允许使用样本大小列。若未列出任何列,则假定样本大小为 1。p 的连结函数为 Logit。若选择建模类型为“名义型”的二值响应变量,则只有“二项”是可用的响应分布。请参见分布的统计详细信息
Y 服从成功概率为 p、试验次数为 n 且过度离散参数为 δ. 的 beta 二项分布。该分布是过度离散版本的二项分布。
运行 JMP Samples/Scripts 文件夹中的 demoBetaBinomial.jsl,将具有离散参数 δ 的 beta 二项分布与具有参数 pn = 20 的二项分布进行比较。
Y 服从均值为 λ 的 Poisson 分布。 Poisson 分布通常对给定时间间隔中的事件数建模,经常表示为计数数据。λ 的连结函数为对数。即使 Y 采用非整数值,Poisson 回归也是允许的。请参见分布的统计详细信息
Y 服从均值为 μ 且离散参数为 σ 的负二项分布。 负二项分布通常对指定失败次数之前的成功次数建模。负二项分布也等价于某些条件下的 Gamma Poisson 分布。有关负二项和 Gamma Poisson 之间关系的更多详细信息,请参见《基本分析》手册中的二元分析
运行 JMP Samples/Scripts 文件夹中的 demoGammaPoisson.jsl,将具有均值 λ 和离散参数 σ 的 Gamma Poisson 分布与具有均值 λ 的 Poisson 分布进行比较。
μ 的连结函数为对数。即使 Y 采用非整数值,负二项回归也是允许的。请参见分布的统计详细信息
零泛滥
Y 服从参数为 pn 且零泛滥参数为 π 的零泛滥二项分布。 响应 Y 指示所有试验中具有固定概率 pn 个独立试验中的总成功次数。该分布允许使用样本大小列。若未列出任何列,则假定样本大小为 1。p 的连结函数为 Logit。请参见分布的统计详细信息
Y 服从成功概率为 p、试验次数为 n、过度离散参数为 δ 且零泛滥参数为 π 的 beta 二项分布。 该分布是过度离散版本的零泛滥二项分布。零泛滥 beta 二项分布对于每个观测要求样本大小大于 1。因此,用户必须指定一个样本大小列。要插入样本大小列,请按如下顺序将两个连续列指定为 Y:成功次数和试验次数。p 的连结函数为 Logit。请参见分布的统计详细信息
Y 服从均值参数为 λ 且零泛滥参数为 π 的零泛滥 Poisson 分布。 参数 λ 是基于来自 Poisson 分布的观测值(而非来自于泛滥的零值)的条件均值。λ 的连结函数为对数。即使 Y 采用无观测零值或非整数值,零泛滥 Poisson 回归也是允许的。请参见分布的统计详细信息
Y 服从位置参数为 μ,、离散参数为 σ, 且零泛滥参数为 π 的零泛滥负二项分布。 参数 μ 是基于来自负二项分布的观测值(而非来自于泛滥的零值)的条件均值。μ 的连结函数为对数。即使 Y 采用无观测零值或非整数值,零泛滥负二项回归也是允许的。请参见分布的统计详细信息
Y 服从均值参数为 μ 且零泛滥参数为 π 的零泛滥 gamma 分布。 在很多时候,我们可能认为非零响应服从 gamma 分布。这对于保险索赔是成立的:索赔值近似服从 gamma 分布,但是对于没有任何索赔的保险单,数据中也有零。零泛滥 gamma 可以直接处理这类数据而不必将数据分为零和非零响应。参数 μ 是基于来自 gamma 分布的观测值(而非来自于泛滥的零值)的条件均值。μ 的连结函数为对数。请参见分布的统计详细信息
服从各种分布的 Y 的要求列出了被分配各种分布的 Y 变量的数据类型、建模类型和其他要求。
μ, σ
μ, σ
μ, σ
μ, σ
μ, σ
n, p
n, p, δ
μ, σ
n, p, π(零泛滥)
n, p, δ, π(零泛滥)
λ, π(零泛滥)
μ, σ, π (零泛滥)
μ, σ, π (零泛滥)
在选择合适的分布后,点击运行。随即显示“广义回归”报表窗口。