製造業における部品や工程、および医学分野における検体などの測定値を数百あるいは数千も含むような大規模なデータを分析するには、革新的な統計手法が必要です。「説明変数のスクリーニング」プラットフォームは、多くの説明変数をスクリーニングし、応答変数を予測する能力が高いものを選び出します。「説明変数のスクリーニング」を使うと、たとえば、ある症状を持つ患者と持たない患者から検体を採り、試験した数千というバイオマーカーの中から発症の予測に有効なものを特定できます。
「説明変数のスクリーニング」は、「応答のスクリーニング」とは異なります。「応答のスクリーニング」は、説明変数を1変数ずつ検定します。「説明変数のスクリーニング」では、ブートストラップ森を使い、応答変数に対する各説明変数の寄与度を評価します。このブートストラップ森は、モデルのなかに複数の説明変数を含んでいます。「説明変数のスクリーニング」では、たとえ1変数だけでは弱かったとしても、他の説明変数と組み合わされたときに強い予測能力を持つような説明変数を特定します。応答のスクリーニングを参照してください。
図23.1 「説明変数のスクリーニング」レポートの例