交易项矩阵是这样一个矩阵:其中的每行对应一单交易,每列对应一项。矩阵条目由 0 和 1 构成。若某项出现在某个交易中,相应的行和列条目为 1。否则,行和列条目为 0。由于在交易项矩阵包含的值中,0 通常多于 1,所以称之为稀疏矩阵。
nTran 定义为交易项矩阵中的交易(行)数,nItems 定义为交易项矩阵中的项(列)数,nVec 定义为指定的奇异向量数。请注意,nVec 必须小于或等于 min(nTran, nItem)。由此判定:U 是一个 nTran x nVec 矩阵,该矩阵包含交易项矩阵的左奇异向量。S 是维 nVec 的对角矩阵。S 中的对角线元素是交易项矩阵中的奇异值。V‘ 是 nVec * nItem 矩阵。V‘ 中的行(或 V 中的列)是右奇异向量。
右奇异向量可以获取具有相似功能或主题领域的不同项之间的关联。若三个项倾向于出现在相同的交易中,SVD 可能在 V‘ 中生成一个奇异向量,其中这三个项对应的值都很大。U 奇异向量表示交易在新的项空间的投影。
在执行奇异值分解之前,将对交易项矩阵进行中心化和统一尺度,并在除以 nTran 后减 1。该分析等同于交易项矩阵的相关性矩阵的 PCA。SVD 实现利用交易项矩阵的稀疏性。