奇异值分解 (SVD) 通过提供另一种方法来识别彼此具有密切关联的项,从而对关联分析进行了补充。交易项矩阵的奇异值分解将矩阵简化为数量可控的若干维,从而支持您对相似交易和相似项分组。SVD 分析等同于对相关性矩阵执行主成分分析 (PCA)。
交易项矩阵是这样一个矩阵:其中的每行对应一单交易,每列对应一项。矩阵条目由 0 和 1 构成。若某项出现在某个交易中,相应的行和列条目为 1。否则,行和列条目为 0。由于在交易项矩阵包含的值中,0 通常多于 1,所以称之为稀疏矩阵。
偏奇异值分解使用三个矩阵来近似列标准化的交易项矩阵:U、S 和 V′。这三个矩阵的关系定义如下:
交易项矩阵 ≈ U * S * V′
nTran 定义为交易项矩阵中的交易(行)数,nItems 定义为交易项矩阵中的项(列)数,nVec 定义为指定的奇异向量数。请注意,nVec 必须小于或等于 min(nTran, nItem)。由此判定:U 是一个 nTran x nVec 矩阵,该矩阵包含交易项矩阵的左奇异向量。S 是维 nVec 的对角矩阵。S 中的对角线元素是交易项矩阵中的奇异值。V′ 是 nVec * nItem 矩阵。V′ 中的行(或 V 中的列)是右奇异向量。
右奇异向量可以获取具有相似功能或主题领域的不同项之间的关联。若三个项倾向于出现在相同的交易中,SVD 可能在 V′ 中生成一个奇异向量,其中这三个项对应的值都很大。U 奇异向量表示交易在新的项空间的投影。
SVD 还获取间接关联。若两个项从不一起出现在同一交易中,但是它们通常出现在具有第三个项的交易中,则 SVD 可以获取一些这样的关联。若两单交易没有相同的项但是其包含的项在降维空间中有关联,则它们在 SVD 图中映射的向量会很类似。
SVD 将交易数据变换为固定维的向量空间,使它适用于聚类、分类和回归技术。使用“保存”选项可以将这个向量空间导出到其他 JMP 平台去分析。
在执行奇异值分解之前,将对交易项矩阵进行中心化和统一尺度,并在除以 nTran 后减 1。该分析等同于交易项矩阵的相关性矩阵的 PCA。SVD 实现利用交易项矩阵的稀疏性。