发布日期: 11/15/2021

保存的公式

本节给出通过得分选项 > 保存公式保存的推导公式。这些公式依赖于判别方法。

对于由分类变量 X 定义的每个组,假定协变量的观测服从 p 维多元正态分布,其中 p 是协变量数。表 5.2 中给出了公式中使用的符号。

表 5.2 “保存公式”选项给出的公式符号

p

协变量数

T

组(X 的水平)总数

t = 1,..., T

用于区分由 X 定义的各组的下标

nt

t 组中的观测数

n = n1 + n2 + ... + nT

总观测数

y

某个观测的协变量的 1 x p 向量

Equation shown here

t 中第 i 个观测,它包含 p 个协变量的向量

Equation shown here

针对组 t 中的观测,协变量 y 的均值的 1 x p 向量

ybar

所有观测的协变量均值的 1 x p 向量

Equation shown here

估计的第 t 组的组内协方差矩阵 (p x p)

Equation shown here

估计的 (p x p) 合并的组内协方差矩阵

qt

t 的成员关系的先验概率

p(t|y)

y 属于组 t 的后验概率

|A|

矩阵 A 的行列式

线性判别方法

在线性判别分析中,假定所有组内协方差矩阵是相等的。共同协方差矩阵通过 Sp 来估计。请参见表 5.2 了解相关符号。

观测 y 到组 t 的 Mahalanobis 距离按以下方式定义:

Equation shown here

观测 y 属于第 t 组的似然函数按以下方式估计:

Equation shown here

请注意,必须为合并的协方差矩阵估计的参数数目是 p(p+1)/2,必须为均值估计的参数数目是 Tp。必须估计的参数总数是 p(p+1)/2 + Tp

按以下方式定义组 t 中的成员关系的后验概率:

Equation shown here

观测 y 被分配给具有最大后验概率的组。

按以下方式定义“线性”判别方法所保存的公式:

SqDist[0]

Equation shown here

SqDist[<组 t>]

Equation shown here

Prob[<组 t>]

Equation shown here

Pred <X>

t,对于它 p(t|y) 为最大值,t = 1, ..., T

二次判别方法

在二次判别分析中,不假定组内协方差矩阵是相等的。组 t 的组内协方差矩阵由 St 估计。这意味着必须为组内协方差矩阵估计的参数数目是 Tp(p+1)/2,必须为均值估计的参数数目是 Tp。必须估计的参数总数是 Tp(p+3)/2

组样本大小相对于 p 很小时,组内协方差矩阵的估计值倾向于很不稳定。判别得分受组内协方差矩阵的逆矩阵的最小特征值影响很大。请参见 Friedman (1989)。因此,若您的组样本大小相对于 p 来说很小,您可能要考虑正则判别方法中所述的“正则”方法。

请参见表 5.2 了解相关符号。观测 y 到组 t 的 Mahalanobis 距离按以下方式定义:

Equation shown here

观测 y 属于第 t 组的似然函数按以下方式估计:

Equation shown here

t 的成员关系的后验概率为:

Equation shown here

观测 y 被分配给具有最大后验概率的组。

按以下方式定义“二次”判别方法所保存的公式:

SqDist[<组 t>]

Equation shown here

Prob[<组 t>]

Equation shown here

Pred <X>

t,对于它 p(t|y) 为最大值,t = 1, ..., T

注意:SqDist[<组 t>] 可为负。

正则判别方法

“正则”判别分析允许两个参数:λγ

参数 λ 权衡分配给合并的协方差矩阵和组内协方差矩阵(不假定相等)的权重。

参数 γ 确定向对角矩阵的收缩量。

该方法允许您利用正则化的两个特征,提高了二次判别分析估计值的稳定性。请参见 Friedman (1989)。请参见表 5.2 了解相关符号。

对于正则方法,组 t 的协方差矩阵为:

Equation shown here

观测 y 到组 t 的 Mahalanobis 距离按以下方式定义:

Equation shown here

观测 y 属于第 t 组的似然函数按以下方式估计:

Equation shown here

按以下方式计算组 t 的成员关系的后验概率:

Equation shown here

观测 y 被分配给具有最大后验概率的组。

“正则”判别方法所保存的公式定义如下:

SqDist[<组 t>]

Equation shown here

Prob[<组 t>]

Equation shown here

Pred <X>

t,对于它 p(t|y) 为最大值,t = 1, ..., T

注意:SqDist[<组 t>] 可为负。

宽线性判别方法

当您有很多协变量特别是协变量数超过观测数 (p > n) 时,“宽线性”方法很有用。该方法的核心是高效计算合并的组内协方差矩阵 Sp 的逆矩阵或它的转置矩阵(若 p > n)。它使用奇异值分解方法来避免为大的协方差矩阵反转和分配空间。

“宽线性”方法假定组内协方差矩阵相等,若观测数等于或超过协变量数,则该方法等效于“线性”方法。

宽线性计算

请参见表 5.2 了解相关符号。在“宽线性”计算中使用以下步骤:

1. 计算组内样本均值的 T x p 矩阵 MM 的第 (t,j) 个元素 mtj 是第 j 个协变量上的组 t 成员的样本均值。

2. 对于每个协变量 j,计算各组的合并标准差。称之为 sjj

3. Sdiag 表示具有对角元素 sjj 的对角矩阵。

4. 对每个协变量的值进行中心化和统一尺度:

减去观测所属组的均值。

将差值除以合并标准差。

使用符号,对于组 t 中的观测 i,第 j 个协变量的组中心化和统一尺度值为:

Equation shown here

符号 t(i) 表示观测 i 所属的组 t

5. Ys 表示 Equation shown here 值的矩阵。

6. R 表示组中心化和统一尺度的协变量的合并组内协方差矩阵。按以下方式计算矩阵 R

Equation shown here

7. 将奇异值分解应用到 Ys

Equation shown here

其中 UV 是正交的,D 是对角线上具有正元素(奇异值)的对角矩阵。请参见奇异值分解

R 可以表示为:

Equation shown here

8. R 是满秩的,按以下方式得到 R-1/2

Equation shown here

其中 D-1 是对角矩阵,其对角元素为 D 的对角元素的逆。

R 不是满秩的,则按以下方式定义 R 的伪逆矩阵:

Equation shown here

然后按以下方式定义 R 的平方根倒数:

Equation shown here

9. R 是满秩的,结果就是 R- = R-1。因此,为了保持完整性,我们使用伪逆矩阵继续讨论。

按以下方式定义 p x p 的矩阵 Ts

Equation shown here

则:

Equation shown here

其中,S-p 是使用 SVD 计算的原始数据的合并组内协方差矩阵的广义逆矩阵。

Mahalanobis 距离

Mahalanobis 距离、似然函数和后验概率的公式与线性判别方法中所述的那些公式相同。但是,Sp 的逆矩阵由使用奇异值分解计算的广义逆矩阵替代。

当您保存公式时,Mahalanobis 距离以分解的形式给出。对于观测 y,到组 t 的平方距离如下所示,其中最后一个等式中的 SqDist[0] 和判别主成分。在保存的公式中定义:

Equation shown here

保存的公式

这些是“宽线性”判别方法所保存的公式:

判别数据矩阵

观测值在协变量上的向量

判别主成分

使用主成分得分矩阵变换的数据,它呈现组内不相关的数据。通过 Equation shown here 给出,其中 Equation shown here 是包含总均值的 1 x p 向量。

SqDist[0]

Equation shown here

SqDist[<组 t>]

观测值到组重心的 Mahalanobis 距离。请参见Mahalanobis 距离

Prob[<组 t>]

Equation shown here,在线性判别方法中给出

Pred <X>

t,对于它 p(t|y) 为最大值,t = 1, ..., T

需要更多信息?有问题?从 JMP 用户社区得到解答 (community.jmp.com).