“响应筛选”自动执行对大量的响应进行检验的过程。它针对您指定的每个因子检验所选的每个响应。响应筛选解决了有关大规模数据的两个主要问题:其一是需要执行很多检验,其二是需要有效地处理离群值和缺失值。
响应筛选有一个单独的平台,同时也存在于拟合模型平台的分析方法特质中。在这两种情况下,它执行与“以 X 拟合 Y”平台中类似的检验,如表 24.1 中所示。将响应筛选作为特质使用时,它针对各个模型效应执行响应检验。
为了帮助和支持多个统计推断的分析,“响应筛选”提供以下功能:
数据表
结果显示在数据表和报表中,这样您可以探索、排序、搜索您的结果并进行绘图。同时提供便于解释图的统计量,如 p 值的 LogWorth (-log10(p 值))。
假发现率
因为您执行的检验很多,需要控制将检验判定为显著的总比率。响应筛选可控制假发现率。假发现率 (FDR) 是显著检验被错误地声明为显著的期望比例(Benjamini and Hochberg 1995;Westfall et al. 2011)。
实际显著性的检验
当您的数据表包含很多行(n 很大)时,检验中使用的标准误差会很小。因此,检验可能在统计上是显著的,但实际上观测到的差值太小,没有实效性影响。要解决该问题,您可以定义一个视为具有实际显著性的效应大小。然后便可执行实际显著性的检验,因此只检测足够大到有实际影响的效应。
等价性检验
研究很多因子时,您通常关注那些对响应具有基本同等影响的因子。在这种情况下,您可以指定达到实际等价性时的效应大小,然后执行等价性检验。
为了解决处理零乱数据引起的问题,“响应筛选”提供了处理离群值和缺失数据的功能。使用这些功能,您可以直接分析数据,而不必先解决数据质量问题:
稳健估计
您数据中的离群值会增大标准误差的估计值,导致检验对真实效应不敏感。选择“稳健”选项来执行 Huber M 估计,这样离群值仍在数据中,但是可降低检验对这些离群值的敏感度。
缺失值选项
该平台包含一个选项来以信息性方式处理分类预测变量中的缺失值。
响应 |
因子 |
“以 X 拟合 Y”分析 |
说明 |
---|---|---|---|
连续 |
分类 |
单因子 |
方差分析 |
连续 |
连续 |
二元 |
简单线性回归 |
分类 |
分类 |
列联 |
卡方 |
分类 |
连续 |
Logistic |
简单 Logistic 回归 |
“响应筛选”平台生成图部分和报表部分。默认显示“FDR p 值”图和“结果表”。“响应筛选”特质生成一个报表,其中包含“效应检验”表、“效应的 FDR p 值图”和“FDR LogWorth 依据: 效应大小”图。
JSL 命令 Summarize YbyX 执行与“响应筛选”平台相同的功能,但是不创建平台窗口。请参见《JSL Syntax Reference》中的Summarize YByX(X(<x columns>, Y (<y columns>), Group(<grouping columns>), Freq(<freq column>), Weight(<weight column>))。