[連続分布のあてはめ]または[離散分布のあてはめ]の各オプションを使用することにより、連続変数に特定の確率分布をあてはめることができます。
メモ: JMP 15では、分布のあてはめの一部の機能が新しくなりました。ここでは、互換性のために残されているJMP旧版の機能について説明します。旧版のメニューを表示するには、変数の赤い三角ボタンをクリックし、[連続分布のあてはめ]>[旧版のメニューを有効にする]を選択してください。
ヒストグラム上に曲線が表示され、レポートウィンドウに新たに「パラメータ推定値」レポートが表示されます。赤い三角ボタンのメニューには、追加のオプションが表示されます。あてはめた分布のオプション(旧版)を参照してください。
メモ: 「寿命の一変量」プラットフォームでも、様々な分布をあてはめることができます。ただし、「一変量の分布」プラットフォームとは、確率密度関数のパラメータ表現が異なるものもあります。また、「寿命の一変量」プラットフォームでは、打ち切りデータを扱えます。『信頼性/生存時間分析』の寿命の一変量を参照してください。
ここでは、[旧版のあてはめメニュー]に含まれる分布について説明します(これらの分布は、新しい[連続分布のあてはめ]に含まれる同じ名前の分布と異なります)。
• Weibull分布、閾値つきWeibull分布、極値分布。これらの分布は、特に、工業製品の故障時間や、生物学の生存時間を分析するときに使われています。
• ガンマ分布。この分布も、下限値は0です。
• ベータ分布。(0, 1)の区間を範囲としています。標準ベータ分布は、割合などの0から1の範囲に収まるデータに対してよく使われています。
• [平滑曲線]分布は、ノンパラメトリックな密度の推定値(カーネル密度推定)を計算し、平滑曲線をあてはめます。ヒストグラム上に平滑曲線が表示され、プロットの下にスライダが表示されます。スライダを使ってカーネル標準偏差を変更することで、平滑化の度合いを調節できます。[カーネル標準偏差]の初期値は、データの標準偏差に基づいて算出されます。
• Johnson Su分布、Johnson Sb分布、Johnson Sl分布。これら3つで構成される分布システムは、歪度と尖度のあらゆる組み合わせに対応しており、柔軟にデータにあてはまります。
• 一般化対数分布(Glog分布)。生物検定法(バイオアッセイ)など、分散が一定でない非正規なデータに役立ちます。
[すべて]オプションは、現在のデータに適用可能なすべての分布をあてはめます。「分布の比較」レポートに、あてはめられた各分布の統計量が表示されます。チェックボックスで分布を選択することによって、その分布のレポート、およびヒストグラム上に描かれる密度曲線の表示/非表示を切り替えることができます。デフォルトでは、データに最も適合している分布のチェックボックスがオンになっています。
「分布」のリストは、AICcの値で昇順に並んでいます。
変数に負の値がある場合は、正の値のみを対象とする分布は除外されます。このコマンドの対象は連続分布のみです。すべての場合において、閾値パラメータがある分布(ベータ分布やJohnson Sb 分布など)は除外されます。
統計的詳細については、次の節を参照してください。
[離散分布のあてはめ]オプションは、データの値がすべて整数のときのみ使用できます。[離散分布のあてはめ]の各オプションは、離散値のデータに対して、Poisson分布や二項分布などをあてはめます。分布の種類は次のとおりです。
• Poisson
• ガンマPoisson
• 二項
• ベータ二項
統計的詳細については、次の節を参照してください。
あてはめた分布の各レポートには、赤い三角ボタンがあり、クリックすると追加のオプションが表示されます。
診断プロット
分位点プロットまたは確率プロットが作成されます。診断プロットを参照してください。
密度曲線
分布のパラメータ推定値を基に密度曲線が計算され、ヒストグラムに重ねて表示されます。
適合度
あてはめた分布に対して、適合度検定が計算されます。適合度を参照してください。
分布パラメータの指定
一部のパラメータを任意の値に固定し、他のパラメータを推定することができます。また、入力したパラメータ値がデータにあてはまるかどうかが検定され、その結果が「妥当性の尤度比検定」レポートとして表示されます。
分位点
このオプションを選択すると、指定した下側累積確率に対して、尺度化も中心化もしていない分位点が戻されます。
Kシグマから仕様限界を設定
設定すべき仕様限界(規格限界)が決まっておらず、データから求めたい場合にこのオプションを使ってください。
仕様限界は、工程を工学的に検討して決めるのが普通です。工学的な検討が行えず、かつ、優れた工程から取得したデータがある場合は、そのデータに分布をあてはめて、その分位点を仕様限界としてもよいでしょう。Kシグマから仕様限界を設定を参照してください。
仕様限界
指定した仕様限界と目標値を基に、一般化された工程能力指数が計算されます。仕様限界を参照してください。
あてはめたモデルの分位点を保存
あてはめた分布の分位点が、データテーブルの列に保存されます。あてはめたモデルの分位点の統計的詳細(旧版)を参照してください。
密度関数の保存
あてはめた分布の密度関数が、データテーブルの列に保存されます。密度関数では、パラメータ推定値が使用されます。
仕様限界の保存
仕様限界を列プロパティとして保存します。
変換の計算式を保存
正規分布に変換するための計算式が保存されます。この計算式は、あてはめた分布に基づいて、データを正規分布に近づくように変換するものです。このオプションは、Johnson分布、一般化対数分布、またはSHASH分布があてはめられた場合にのみ使用できます。
あてはめの削除
分布のあてはめに関する情報がレポートウィンドウから削除されます。
[診断プロット]オプションを選択すると、分位点プロットまたは確率プロットが作成されます。あてはめた分布に応じて、作成されるプロットは次の4つの形式のいずれかになります。
• 閾値つきWeibull
• ガンマ
• Beta
• Poisson
• ガンマPoisson
• 二項
• ベータ二項
• 正規
• 正規混合
• 指数
• Weibull損失関数
• 対数正規
• 極値損失関数
• SHASH
• Johnson Sl
• Johnson Sb
• Johnson Su
• 一般化対数
「診断プロット」の赤い三角ボタンのメニューには、次のオプションが表示されます。
回転
X軸とY軸を入れ換えます。
信頼限界
正規分位点プロットではLillieforsの95%信頼限界、その他の分位点プロットではa = 0.01、b = 0.99のときの95%等精度信頼帯(95% equal precision band)を表示します(Meeker and Escobar 1998)。
あてはめ線
参照線としてまっすぐな対角線を表示します。変数の値がこの参照線の付近にあるなら、選択した分布が変数にあてはまっていることがわかります。
中央値の参照線
応答変数の中央値を示す水平線を表示します。
[適合度]オプションを選択すると、あてはめた分布に対して、適合度検定が計算されます。ここでの適合度検定は、カイ2乗検定ではなく、経験分布関数(EDF; Empirical Distribution Function)に基づく検定です。経験分布関数に基づく検定は、カイ2乗検定よりも検出力が高く、ヒストグラムの中間点によって検定結果が変わらないという点でカイ2乗検定より優れています。
• 正規分布については、標本サイズが2000以下のときは正規性に関するShapiro-Wilkの検定が、標本サイズが2000より大きいときはKSL(Kolmogorov-Smirnov-Lilliefors)の検定が計算されます。
• 離散分布において標本サイズが30以下の場合は、2つの正確なKolmogorov片側検定を組み合わせて両側検定とした方法(Conover 1972)が使われます。この両側検定は、ほぼ正確です。また、離散分布において標本サイズが30を超える場合は、Pearsonのカイ2乗検定が使われます。
• 詳細については、あてはめた分布のオプション(旧版)を参照してください。
[仕様限界]オプションを選択すると、仕様限界と目標値を入力するためのウィンドウが開きます。指定した値を基に、一般化された工程能力指数が計算されます。正規分布では、中央値(平均値)から下側に3σ離れた位置は、0.135パーセント点です。また、上側に3s離れた位置は、99.865パーセント点です。一般化された工程能力指数は、あてはめた分布のこれらのパーセント点から計算されます。正規分布を仮定した標準の計算式では、該当するパーセント点から中央値までの距離は3σです。
• 詳細については、あてはめた分布のオプション(旧版)を参照してください。