アップリフトモデル

消費者調査 > アップリフト > 「アップリフトモデル」レポート > アップリフトモデル

公開日: 09/19/2023

アップリフトモデル

アップリフトモデルは一種のパーティションモデルです。このモデルのグラフは、縦軸上の各区画は、分岐によって構成された各ノードにおける観測値の平均や割合を表しています。そして、横軸は、分岐によって構成されたノードを表します。ノードごとに描かれている黒色の横線は、そのノードの応答の平均を示しています。各ノードには、処置による副分岐を表す赤色または青色の線も描かれています。これらの赤もしくは青の線は、各ノード内における処置による応答の違いを示しています。赤もしくは青の線は、各ノード内において処置で分岐したときに構成される2つのグループの平均応答を示しています。「処置」列におけるデータ値の並び順によって、どちらを「処置1」とするかが決まり、描かれる線が赤色になるか、青色になるかが決まります。分岐を進めていくにしたがって、分岐の条件式（条件式は横軸の下に表示されています）やグラフが更新されていきます。縦の線は、分岐の分かれ目を表しています。

グラフの下に、［分岐］、［剪定］、［実行］というボタンがあります。このうち、［実行］ボタンは、検証データを使用している場合にのみ表示されます。また、「処置」列の名前と、その「処置」列の水準名も表示されます。「処置」列に3つ以上の水準がある場合、最初の水準以外はすべて「処置2」という1つの水準にまとめられ、2水準の応答として処理されます。

「処置」列情報の右側には、予測に関連する要約統計量がレポートされます（ただし、アップリフトモデルにおいては、最良の予測を行うことが分析目的ではない点に注意してください）。レポートは、分岐が実行されるたびに更新されます。検証データを使用している場合、学習データと検証データの両方に対する要約統計量が表示されます。

R2乗

ツリーに関連する回帰モデルのR2乗。この回帰モデルには、処置列との交互作用も含まれています。R2乗が1に近いほど、モデルのデータへのあてはまりが良いことを示します。

メモ: R2乗が小さい場合は、必要な説明変数がモデルに含まれていない可能性があります。ただし、データのばらつきがもともと大きなものであるときには、有効なアップリフトモデルであってもR2乗値が小さくなる場合もあります。

RMSE

ツリーの回帰モデルにおけるRMSE（Root Mean Square Error; 平均平方誤差の平方根、誤差の標準偏差）。RMSEは、応答変数が連続尺度の場合にのみ算出されます。『基本的な回帰モデル』を参照してください。

観測数（標本サイズ）。

分岐数

分岐が実行された回数。

AICc

回帰モデルを使って計算された、修正済みの赤池の情報量規準（AICc）。AICcは、応答変数が連続尺度の場合にのみ算出されます。『基本的な回帰モデル』の尤度・AICc・BICを参照してください。

アップリフトのディシジョンツリー

レポートに表示されているディシジョンツリーは、アップリフトモデルで使用された分岐を表しています。「Hair Care Product.jmp」データテーブルを使った例は、Figure 6.5を参照してください。描画されたツリーの各ノードには、次の情報が含まれます。

処置

「処置」列の列名と、その「処置」列に含まれている2つの水準が表示されます。

割合

（応答変数が2水準のカテゴリカルの場合にのみ表示されます。）各ノード内で、反応した消費者の割合が、処置の水準ごとに算出されています。

平均

（応答変数が連続尺度の場合にのみ表示されます。）各ノード内で処置の水準ごとに、応答の平均が表示されます。

度数

各ノード内で処置の水準ごとに、標本サイズ（たとえば、調べた消費者の人数）が表示されます。

t値

処置の水準間における差を検定するときに使われるt値。なお、応答変数がカテゴリカルな場合は、この統計量は、連続尺度（0と1）に変換された後に算出されます。

処置差

処置水準間の応答平均の差。これがアップリフトと呼ばれるもので、次のように仮定して計算されます。

– 「処置」列の値において、最初の水準が「処置群」を表し、それ以外の水準は「対照群」を表す。

– 応答変数の値は、値が大きいほど、ポジティブであることを示している。

対数価値

各ノードにおける、後続の分岐がもつ対数価値。

図6.5 最初の分岐のノード

最初の分岐のノード

「候補」レポート

各ノードには「候補」レポートと追加の情報も含まれます。

項

モデルの項。

対数価値

各項でのすべての分岐のうちで、分岐による統計量が最大となったときの対数価値。「対数価値」は、‐log10(p)で計算される（ここで、pは、調整済みp値）

F値

応答変数が連続尺度の場合は、線形回帰モデルの交互作用項に対するF値。応答変数がカテゴリカルの場合は、名義ロジスティックモデルの交互作用項に対するカイ2乗値。いずれの回帰モデルも、処置、二分岐、および、それらの交互作用という3つの効果から構成されます。

ガンマ

応答変数が連続尺度の場合は、線形回帰モデルにおける交互作用の推定値。応答変数がカテゴリカルの場合は、名義ロジスティックモデルをFirthバイアス調整法で推定したときの、交互作用の推定値。

分岐点

該当の説明変数が連続尺度の場合は、分岐点が表示されます。該当の説明変数がカテゴリカルの場合は、最初（左）のノードに属するカテゴリが表示されます。

より詳細な情報が必要な場合や、質問があるときは、JMPユーザーコミュニティで答えを見つけましょう (community.jmp.com).