“响应筛选”自动执行对大量的响应进行检验的过程。它针对您指定的每个因子检验所选的每个响应。响应筛选解决了有关大规模数据的两个主要问题:其一是需要执行很多检验,其二是需要有效地处理离群值和缺失值。
响应筛选有一个单独的平台,同时也存在于拟合模型平台的分析方法特质中。在这两种情况下,它执行与“以 X 拟合 Y”平台中类似的检验,如表 22.1 中所示。 将响应筛选作为特质使用时,它针对各个模型效应执行响应检验。
为了帮助和支持多个统计推断的分析,“响应筛选”提供以下功能:
数据表
结果显示在数据表和报表中,这样您可以探索、排序、搜索您的结果并进行绘图。同时提供便于解释图的统计量,如 p 值的 LogWorth。
假发现率
因为您执行的检验很多,需要控制将检验判定为显著的总比率。响应筛选可控制假发现率。假发现率 (FDR) 是显著检验被错误地声明为显著的期望比例(Benjamini and Hochberg 1995;Westfall et al. 2011)。
实际显著性的检验
当您有很多观测值时,即使没有实际意义的小效应也可能导致统计显著性。要解决该问题,您可以定义一个视为具有实际显著性的效应大小。然后便可执行实际显著性的检验,因此只检测足够大到有实际影响的效应。
等价性检验
研究很多因子时,您通常关注那些对响应具有基本同等影响的因子。在这种情况下,您可以指定达到实际等价性时的效应大小,然后执行等价性检验。
为了解决处理零乱数据引起的问题,“响应筛选”提供了处理离群值和缺失数据的功能。使用这些功能,您可以直接分析数据,而不必先解决数据质量问题:
稳健估计
您数据中的离群值会增大标准误差的估计值,导致检验对真实效应不敏感。选择“稳健”选项来执行 Huber M 估计,这样离群值仍在数据中,但是可降低检验对这些离群值的敏感度。
缺失值选项
平台包含一个选项来以信息性方式处理分类预测变量的缺失值。
响应 |
因子 |
“以 X 拟合 Y”分析 |
说明 |
---|---|---|---|
连续 |
分类 |
单因子 |
方差分析 |
连续 |
连续 |
二元 |
简单线性回归 |
分类 |
分类 |
列联 |
卡方 |
分类 |
连续 |
Logistic |
简单 Logistic 回归 |
“响应筛选”平台生成一个报表和一个数据表:“响应筛选”报表和“P 值”表。拟合模型中的“响应筛选”特质生成一个报表和两个数据表:“拟合响应筛选”报表、“P 值”表和“Y 拟合”表。
JSL 命令 Summarize YbyX 执行与“响应筛选”平台相同的功能,但是不创建平台窗口。请参见《JSL Syntax Reference》中的Summarize YByX(X(<x columns>, Y (<y columns>), Group(<grouping columns>), Freq(<freq column>), Weight(<weight column>))。