この節には、「パターンを調べる」プラットフォームで最長連および最長の重複パターンの希少性の計算についての統計的詳細が記載されています。
最長連の希少性を計算するには、まず以下の変数を定義します。
n = 列内の行数
k = 特定の値が列内で出現する回数
p = k/n = 列内で特定の値が観察される確率
m = 連の長さ
N = 一意の連の数
その後、以下の式を使って最長連の希少性が計算されます。
希少性 = −log2(1 − (1 − pm - 1)N)
最長パターンの希少性を計算するには、まず以下の変数を定義します。
p = 列内で特定のパターンが1回観察される確率
k = 列内でパターンの開始値が出現する回数
その後、以下の式を使って最長パターンの希少性が計算されます。
希少性 = −log2(1 − (1 − p)k)