分布のあてはめ

基本的な統計分析 > 一変量の分布 > 連続変数のオプション > 分布のあてはめ

公開日: 09/19/2023

分布のあてはめ

分析対象の列の尺度が「連続尺度」である場合には、［連続分布のあてはめ］または［離散分布のあてはめ］の各オプションのサブメニューを使用することにより、特定の確率分布をあてはめることができます。「連続尺度」の列に分布をあてはめると、ヒストグラムに曲線が追加されます。また、「分布の比較」レポートと、「分布のあてはめ」レポートがレポートウィンドウに追加されます。「分布のあてはめ」レポートには赤い三角ボタンがあり、そこで追加のオプションを選択できます。あてはめた分布のオプションを参照してください。「一変量の分布」レポートでは、列に［分布］列プロパティが含まれている場合、そこで指定されている確率分布がデフォルトであてはめられます。

メモ: 「寿命の一変量」プラットフォームでも、様々な確率分布をあてはめることができます。ただし、「一変量の分布」プラットフォームとは、確率密度関数のパラメータ表現が異なるものもあります。また、「寿命の一変量」プラットフォームでは、打ち切りデータを扱えます。『信頼性/生存時間分析』の寿命の一変量を参照してください。

連続分布のあてはめ

［連続分布のあてはめ］のサブメニューには、連続分布をあてはめるためのオプションが含まれています。確率分布の詳細については、連続分布のあてはめの統計的詳細を参照してください。

正規のあてはめ

データに正規分布をあてはめます。正規分布は、分布が左右対称で、ほとんどのデータが中央にある分布です。正規分布は、負の値や小数点などが、データにあってもかまいません。ここでの標準偏差推定値は、不偏分散推定値の平方根です。

Cauchyのあてはめ

データにCauchy分布をあてはめます。Cauchy分布には、平均と標準偏差がありません。ほとんどのデータは本来Cauchy分布には従いませんが、外れ値の割合が大きいデータ（最大50%のものが外れ値となっているようなデータ）に対してロバストな位置と尺度を推定するときに役立ちます。

Studentのtのあてはめ

Studentのt分布をデータにあてはめます。Studentのt分布は、正規分布とCauchy分布の間の空間に広がるロバストな分布です。Studentのt分布は、自由度が無限に近づくと正規分布と等しくなり、自由度が1になると、Cauchy分布と等しくなります。「一変量の分布」プラットフォームは、自由度の値も推定します。

SHASHのあてはめ

データにSHASH分布（sinh-arcsinh分布）をあてはめます。Johnson分布と同じく、正規分布へと変換できる分布です。SHASH分布は、特殊な場合として正規分布も含んでいます。また、SHASH分布は、対称な分布と非対称な分布を含んでいます。

指数のあてはめ

（負の観測値がないときにのみ使用できます。）データに指数分布をあてはめます。指数分布は右に裾をひいた形状です。生存時間や連続するイベント間の時間をモデル化するのによく使用されます。

ガンマのあてはめ

（すべての観測値が正の値である場合にのみ使用できます。）データにガンマ分布をあてはめます。ガンマ分布は、正の値を柔軟にモデル化できる分布です。

対数正規のあてはめ

（すべての観測値が正の値である場合にのみ使用できます。）データに対数正規分布をあてはめます。対数正規分布は右に裾をひいた形状です。生存時間や連続するイベントが発生するまでの時間をモデル化するのによく使用されます。対数正規分布のパラメータ推定値は、最尤推定値です。

Weibullのあてはめ

（すべての観測値が正の値である場合にのみ使用できます。）データにWeibull分布をあてはめます。Weibull分布は柔軟で、生存時間やイベントが発生するまでの時間をモデル化するのによく使用されます。

二重正規混合のあてはめ

2重正規混合分布(2つの正規分布を混合した分布)をあてはめます。二峰性の分布にも対応した柔軟な分布です。

三重正規混合のあてはめ

3重正規混合分布(3つの正規分布を混合した分布)をあてはめます。多峰性の分布にも対応した柔軟な分布です。

平滑化曲線のあてはめ

ノンパラメトリックな密度の推定値（「局所的な平滑化」レポート）を計算し、平滑曲線をあてはめます。「ノンパラメトリック密度」レポートに表示されるスライダを使ってバンド幅を変更し、平滑化の度合いを調節できます。

Johnsonのあてはめ

データにJohnson分布をあてはめます。3種類のJohnson分布（Su、Sb、Sl）のうち、最適なものがあてはめられ、レポートが作成されます。Johnson分布族は、歪度と尖度のあらゆる組み合わせに対応しており、柔軟にデータにあてはまります。Johnson分布の選択プロセスとパラメータ推定については、Slifker and Shapiro（1980）を参照してください。

ベータのあてはめ

（すべての観測値が0～1の範囲内に収まる場合にのみ使用できます。）データにベータ分布をあてはめます。0より大きく1より小さいデータをモデル化するのに便利で、割合や比率を表すのによく使用されます。

すべてをあてはめ

変数に対してあてはめることが可能な連続分布をすべてあてはめます。「分布の比較」レポートに、あてはめられた各分布の統計量が表示されます。デフォルトでは、データに最も適合している分布のチェックボックスがオンになり、ヒストグラムにも表示されます。チェックボックスで分布を選択することによって、その分布のレポート、およびヒストグラム上に描かれる密度曲線の表示／非表示を切り替えることができます。「分布の比較」のリストは初期状態で、AICcの値で昇順に並べられます。

ヒント: 「分布の比較」の「分布」列の分布名をダブルクリックすると、その分布をリストからすぐに削除できます。この操作を行うと、その分布のあてはめレポートも削除されます。

旧版のメニューを有効にする

［旧版のあてはめメニュー］の表示／非表示を切り替えます。分布のあてはめの一部の機能はJMP 15で一新されました。このオプションを選択すると、JMPの旧版における機能が使用できるようになります（互換性のため、旧版の機能も残されています）。旧版の機能の使い方については、JMP 16.2のヘルプにある「旧版のあてはめの詳細」をご覧ください。

離散分布のあてはめ

［離散分布のあてはめ］には、離散分布をあてはめるためのオプションが含まれており、データの値がすべて整数の場合に使用できます。確率分布の詳細については、離散分布のあてはめの統計的詳細を参照してください。

Poissonのあてはめ

データにPoisson分布をあてはめます。Poisson分布は、一定期間内に生じているイベントの回数などの度数データをモデル化するのに便利です。

負の二項のあてはめ

データに負の二項分布をあてはめます。負の二項分布は、特定の失敗回数に達するまでの成功回数をモデル化するのに便利です。また、負の二項分布はガンマPoisson分布を別のパラメータ表現で表したものです。

ゼロ強調 Poissonのあてはめ

（データ値にゼロがある場合のみ使用できます。）データにゼロ強調 Poisson分布をあてはめます。この分布は、データがゼロである割合が通常のPoisson分布よりも大きいと仮定しています。

ゼロ強調負の二項のあてはめ

（データ値にゼロがある場合のみ使用できます。）データにゼロ強調負の二項分布をあてはめます。この分布は、データがゼロである割合が通常の負の二項分布よりも大きいと仮定しています。

二項のあてはめ

データに二項分布をあてはめます。この分布は、n回の独立した試行を行ったときの成功回数をモデル化するのに便利です。各試行内においては、成功確率pは一定です。標本サイズは、データのすべての行に対して一定の値を指定するか、または各行での標本サイズを含む列を指定できます。

メモ: 標本サイズが一定でない場合、密度曲線・診断プロット・プロファイルは使用できません。

ベータ二項のあてはめ

データにベータ二項分布をあてはめます。この分布は、二項分布で過分散が生じたときの分布です。この分布では、データの各行における標本サイズが2以上でなければいけません。標本サイズは、データのすべての行に対して一定の値を指定するか、または各行での標本サイズを含む列を指定できます。

メモ: 標本サイズが一定でない場合、密度曲線・診断プロット・プロファイルは使用できません。

あてはめた分布のオプション

あてはめた分布の各レポートには、赤い三角ボタンがあり、クリックすると追加のオプションが表示されます。

密度曲線

分布のパラメータ推定値を基に密度曲線が計算され、ヒストグラムに重ねて表示されます。

診断プロット

以下のオプションがあります。

分位点プロット

分位点プロットの表示／非表示を切り替えます。このプロットは、観測値と分位点との関係を示します。この時に使われる分位点は、推定されたパラメータに基づいた確率分布から算出されます。

確率プロット

確率プロットの表示／非表示を切り替えます。このプロットは、経験累積分布関数と、推定されたパラメータに基づいた確率分布から算出された累積分布関数との関係を示します。

プロファイル

以下のオプションがあります。

分布プロファイル

累積分布関数を描いた予測プロファイルの表示／非表示を切り替えます。

分位点プロファイル

分位点関数を描いた予測プロファイルの表示／非表示を切り替えます。

列の保存

以下のオプションがあります。

密度関数の保存

パラメータ推定値を代入した密度関数が、データテーブルの列に保存されます。

分布関数の保存

パラメータ推定値を代入した累積分布関数が、データテーブルの列に保存されます。

シミュレーション計算式の保存

パラメータ推定値を代入した確率分布に基づいて、値をシミュレーションする計算式が、データテーブルの列に保存されます。このオプションによって保存した列は、「シミュレーション」ユーティリティで切り替え先の列として使用できます。シミュレーションを参照してください。

変換の計算式を保存

（Johnson分布とSHASH分布のあてはめでのみ使用できます。）変換の計算式が、データテーブルの列に保存されます。この計算式は、あてはめた分布に基づいて、Y列を正規分布に従う列へと変換します。

適合度

（Johnson分布・平滑化曲線・正規混合分布・二項分布・ベータ二項分布では使用できません。）「適合度検定」レポートの表示／非表示を切り替えます。このレポートには、あてはめた分布の適合度検定が表示されます。

連続分布のあてはめではAnderson-Darling検定が行われます。p値は、パラメトリックなブートストラップを使用したシミュレーションにより求められます（Stephens（1974）の節4.1で説明されている手順と似ています）。正規分布については、標本サイズが2000以下の場合で固定パラメータがないときは、正規性に関するShapiro-Wilk検定も行われます。

離散分布ではPearsonカイ2乗検定が行われます。

分布パラメータの指定

（Johnson分布または滑らかな曲線のあてはめでは使用できません。）一部のパラメータを任意の値に固定し、他のパラメータを推定することができます。また、入力したパラメータ値がデータにあてはまるかどうかが検定され、その結果が「妥当性の尤度比検定」レポートとして表示されます。

工程能力

（Cauchy分布、Studentのt分布、離散分布のあてはめでは使用できません。）あてはめた分布を使って、工程能力分析を実行します。工程能力分析とは、仕様限界に基づいて工程がどれほど優れているかを調べる方法です。あてはめた分布の赤い三角ボタンをクリックして［工程能力］を選択すると、以下のオプションを指定するウィンドウが開きます。

仕様限界の入力

仕様限界を入力します。あてはめた分布に基づいて仕様限界を計算するには、ここを空白にしたまま、「分位点に基づく仕様限界の計算オプション」の下にあるオプションを使用してください。

分位点に基づく仕様限界の計算オプション

あてはめた分布に基づいて仕様限界を計算します。計算方法は2種類あります。

1つ目は、分位点の確率を指定して、仕様限界を計算する方法です。

2つ目は、Kシグマ乗数を指定して、仕様限界を計算する方法です。この方法では、両側限界または片側限界のいずれかを選択できます。

確率またはシグマ乗数を入力して、［仕様限界の計算］をクリックすると、仕様限界が計算されて、「仕様限界の入力」パネル内にこれらの限界が自動的に入力されます。これらの限界を使って「工程能力」レポートを作成するには、［OK］をクリックしてください。

工程能力分析オプション

以下のオプションがあります。

「移動範囲オプション」アウトラインでは、移動範囲の種類を選択できます。『品質と工程』の移動範囲オプションを参照してください。

「非正規分布のオプション」アウトラインでは、非正規分布に基づく工程能力の計算方法を選択できます。『品質と工程』の非正規分布のオプションを参照してください。

工程能力分析オプションとレポートの詳細については、『品質と工程』の工程能力を参照してください。

メモ: 「一変量の分布」プラットフォームの「工程能力」レポートの主な設定は、［ファイル］>［環境設定］>［プラットフォーム］>［工程能力］で変更できます。

あてはめの削除

分布のあてはめに関する情報がレポートウィンドウから削除されます。

より詳細な情報が必要な場合や、質問があるときは、JMPユーザーコミュニティで答えを見つけましょう (community.jmp.com).