行がトランザクションに、列がアイテムに対応する行列を、ここではトランザクション-アイテム行列と呼びます。トランザクション-アイテム行列は、0と1だけを要素に持ちます。トランザクション-アイテム行列では、あるアイテムがあるトランザクションに出現している場合は、それらに対応する行と列の要素を1にします。出現していない場合は、その要素を0にします。トランザクション-アイテム行列における要素は、1よりも0になっているものが多いです。そのような行列を、「疎な行列(sparse matrix)」と言います。
ここで、nTranを、トランザクション-アイテム行列の行数(トランザクション数)とします。nItemを、トランザクション-アイテム行列の列数(アイテムの個数)とします。また、nVecを、指定した特異ベクトルの次元数とします。このとき、nVecは、min(nTran, nItem)以下でなければなりません。Uは、トランザクション-アイテム行列の左特異ベクトルを含むnTran × nVec行列です。Sは、nVec次の対角行列です。このSの対角成分は、トランザクション-アイテム行列の特異値になっています。V‘は、nVec×nItem行列です。V‘の行(またはVの列)は右特異ベクトルです。
右特異ベクトルは、一緒に生じているパターンが似ているアイテムを反映します。同じトランザクションに出現することの多いアイテムが3つあった場合、特異値分解によって得られる右特異ベクトルV‘では、これらの3つのアイテムに対する値が大きくなります。また、左特異ベクトルUは、各トランザクションが、上記のようなアイテム空間に射影されたものです。
トランザクション-アイテム行列は、特異値分解が実行される前に中心化および尺度化され、nTran - 1 で除算されます。この分析は、トランザクション-アイテム行列の相関行列に対して主成分分析を適用することと同等です。なお、特異値分解を解くアルゴリズムでは、トランザクション-アイテム行列が疎(sprase)であることを利用しています。