预测和专业建模 > 响应筛选 > “响应筛选”平台概述
发布日期: 04/13/2021

“响应筛选”平台概述

“响应筛选”自动执行对大量的响应进行检验的过程。它针对您指定的每个因子检验所选的每个响应。响应筛选解决了有关大规模数据的两个主要问题:其一是需要执行很多检验,其二是需要有效地处理离群值和缺失值。

响应筛选有一个单独的平台,同时也存在于拟合模型平台的分析方法特质中。在这两种情况下,它执行与“以 X 拟合 Y”平台中类似的检验,如Table 21.1中所示。 将响应筛选作为特质使用时,它针对各个模型效应执行响应检验。

为了帮助和支持多个统计推断的分析,“响应筛选”提供以下功能:

数据表

结果显示在数据表和报表中,这样您可以探索、排序、搜索您的结果并进行绘图。同时提供便于解释图的统计量,如 p 值的 LogWorth。

假发现率

因为您执行的检验很多,需要控制将检验判定为显著的总比率。响应筛选可控制假发现率。假发现率 (FDR) 是显著检验被错误地声明为显著的期望比例(Benjamini and Hochberg 1995;Westfall et al. 2011)。

实际显著性的检验

当您有很多观测值时,即使没有实际意义的小效应也可能导致统计显著性。要解决该问题,您可以定义一个视为具有实际显著性的效应大小。然后便可执行实际显著性的检验,因此只检测足够大到有实际影响的效应。

等价性检验

研究很多因子时,您通常关注那些对响应具有基本同等影响的因子。在这种情况下,您可以指定达到实际等价性时的效应大小,然后执行等价性检验。

为了解决处理零乱数据引起的问题,“响应筛选”提供了处理离群值和缺失数据的功能。使用这些功能,您可以直接分析数据,而不必先解决数据质量问题:

稳健估计

您数据中的离群值会增大标准误差的估计值,导致检验对真实效应不敏感。选择“稳健”选项来执行 Huber M 估计,这样离群值仍在数据中,但是可降低检验对这些离群值的敏感度。

缺失值选项

平台包含一个选项来以信息性方式处理分类预测变量的缺失值。

表 21.1 响应筛选执行的分析 

响应

因子

“以 X 拟合 Y”分析

说明

连续

分类

单因子

方差分析

连续

连续

二元

简单线性回归

分类

分类

列联

卡方

分类

连续

Logistic

简单 Logistic 回归

“响应筛选”平台生成一个报表和一个数据表:“响应筛选”报表和“P 值”表。拟合模型中的“响应筛选”特质生成一个报表和两个数据表:“拟合响应筛选”报表、“P 值”表和“Y 拟合”表。

JSL 命令 Summarize YbyX 执行与“响应筛选”平台相同的功能,但是不创建平台窗口。请参见《JSL Syntax Reference》中的Summarize YByX(X(<x columns>, Y (<y columns>), Group(<grouping columns>), Freq(<freq column>), Weight(<weight column>))

需要更多信息?有问题?从 JMP 用户社区得到解答 (community.jmp.com).