奇异值分解 (SVD) 通过提供另一种方法来标识彼此具有亲和关系的项,从而对关联分析进行了补充。事务项矩阵的奇异值分解将矩阵简化为可管理的若干维,从而支持您对相似事务和相似项分组。
事务项矩阵是这样一个矩阵:其中的每行对应一个事务,每列对应一项。矩阵条目由 0 和 1 构成。若某项出现在某个事务中,相应的行和列条目为 1。否则,行和列条目为 0。由于在事务项矩阵包含的值中,0 通常多于 1,所以称之为稀疏矩阵。
nTransactions 定义为事务项矩阵中的事务(行)数,nItems 定义为事务项矩阵中的项(列)数,nVec 定义为指定的奇异向量数。请注意,nVec 必须小于或等于 min(nTransactions, nItems)。它要求 U 是 nTransactions * nVec 矩阵。S 是维 nVec 的对角矩阵。S 中的对角线元素是 SVD 中的奇异值。V‘ 是 nVec * nTransactions 矩阵。V‘ 中的行是奇异向量。