予測モデルおよび発展的なモデル
この『予測モデルおよび発展的なモデル』では、「応答のスクリーニング」、「パーティション」、「ニューラル」などの高度な統計手法を説明します。
• 「ニューラル」プラットフォームは、入力層、出力層、および、1~2層の隠れ層(中間層)をもつ多層パーセプトロンニューラルネットワークをあてはめます。ニューラルネットワークは、柔軟な関数によって、入力変数から1つまたは複数の応答変数を予測します。ニューラルネットワークを参照してください。
• 「パーティション」プラットフォームは、XとYの関係に従ってデータを再帰的に分割し、ディシジョンツリー(決定木)を作成します。パーティションを参照してください。
• 「ブートストラップ森」プラットフォームは、学習データから何回もデータを無作為抽出し、その無作為抽出された各データにディシジョンツリーをあてはめ、それらの結果を組み合わせて予測値を求めます。ブートストラップ森を参照してください。
• 「ブースティングツリー」プラットフォームは、小さなディシジョンツリーをいくつも積み重ねた加法モデルを作成します。各ツリーはそれぞれ少数(通常は5つ以下)の分岐で構成されます。各ツリーは残差に対して再帰的にあてはめられていきます。ブースティングツリーを参照してください。
• 「K近傍法」プラットフォームは、各データ行の予測値を、その近傍にあるデータから求めます。応答変数がカテゴリカルな場合は「分類」を行い、応答変数が連続尺度の場合には「予測」を行います。K近傍法を参照してください。
• 「単純Bayes」プラットフォームは、応答変数がカテゴリカルなデータに対して、分類を行います。なお、分類に使われる説明変数(すなわち、因子)は、データマイニングの分野では「特徴(features)」とも呼ばれています。単純 Bayesを参照してください。
• 「サポートベクトルマシン」プラットフォームは、応答変数がカテゴリカルなデータに対して、分類を行います。このモデルは、クラスを分ける超曲面を最適化することによってデータを分類します。サポートベクトルマシンを参照してください。
• 「モデルの比較」プラットフォームでは、さまざまなモデルの予測能力を比較できます。各モデルの適合度を求めたり、診断プロットを描いたりできます。モデルの比較を参照してください。
• 「検証列の作成」プラットフォームでは、パーティションを作成するための5つの方法のうちいずれかを使用して、データを2つまたは3つのセットに分けます。検証列の作成を参照してください。
• 「計算式デポ」プラットフォームは、モデルの整理や比較、プロファイル作成、スコア計算を行います。「計算式デポ」は、JMPデータテーブルとは切り離して候補となるモデルを保存できますので、モデルを比較するのに便利です。計算式デポを参照してください。
• 「曲線のあてはめ」プラットフォームには、多項式・ロジスティック曲線・Gompertz曲線・指数モデル・ピークモデル・薬物動態モデルなどの非線形モデルがあらかじめ用意されています。これらの非線形モデルをあてはめるのに、モデル式をユーザが設定する必要はありません。各種の分析機能やグラフ機能によって、グループ間の違いなどを検討できます。曲線のあてはめを参照してください。
• 「非線形回帰」プラットフォームでは、推定対象のモデル式やパラメータを指定し、ユーザ自身が定義した非線形モデルをあてはめることができます。非線形回帰を参照してください。
• 「Gauss過程」プラットフォームは、複数の独立変数と、1つの応答変数との間の関係をモデル化します。独立変数と応答変数は、ともに連続尺度である必要があります。Gauss過程モデル(Gaussian process model)は、有限要素法のようなコンピュータによるシミュレーション実験などの分野で、データを完璧に補間するモデルとして広く利用されています。Gauss過程を参照してください。
• 「関数データエクスプローラ」プラットフォームは、関数データを他のJMPプラットフォームで分析可能な形式に変換します。関数データエクスプローラを参照してください。
• 「時系列分析」プラットフォームでは、一変量の時系列データに対する分析や予測ができます。時系列分析を参照してください。
• 「時系列予測」プラットフォームでは、複数の時系列をモデル化し、予測できます。最大30の指数平滑化法のモデルから最も良くあてはまるモデルが自動的に選ばれます。時系列予測を参照してください。
• 「対応のあるペア」プラットフォームでは、相関がある2変数間の平均を比較し、その差を評価します。対応のあるペア分析を参照してください。
• モデル化に関するユーティリティとして、データクリーニングや前処理の機能が用意されています。これらの機能は、データを探索したり、データの理解を深めたりするのに役立ちます。モデル化ユーティリティを参照してください。
• 「応答のスクリーニング」プラットフォームは、応答変数や説明変数が多数ある場合に、それらに対する検定の処理を一度に行います。検定結果や要約統計量は、データテーブルとしても出力されるため、それらの結果をさらに検討できます。応答のスクリーニングを参照してください。
• 「工程のスクリーニング」プラットフォームは、経時的に測定された多数の工程データを探索的に調べます。このプラットフォームによって、管理図や安定性に関する指標や工程能力指数を求めたり、工程に生じた変化を検出したりできます。工程のスクリーニングを参照してください。
• 「説明変数のスクリーニング」プラットフォームを使用すると、データセットから有意な説明変数をスクリーニングできます。説明変数のスクリーニングを参照してください。
• 「アソシエーション分析」プラットフォームは、一緒に登場する頻度が高いアイテム(項目)を探し出します。アソシエーション分析は、「マーケットバスケット分析」とも呼ばれています。同一のトランザクション内において頻繁に一緒に登場している商品を探し出すのによく用いられます。アソシエーション分析を参照してください。
• 「工程履歴エクスプローラ」プラットフォームは、複雑な工程履歴データをもとに、問題のある要素を特定するためのプラットフォームです。工程履歴エクスプローラを参照してください。