预测和专业建模 > 响应筛选 > “响应筛选”平台概述
发布日期: 09/18/2023

“响应筛选”平台概述

“响应筛选”自动执行对大量的响应进行检验的过程。它针对您指定的每个因子检验所选的每个响应。响应筛选解决了有关大规模数据的两个主要问题:其一是需要执行很多检验,其二是需要有效地处理离群值和缺失值。

响应筛选有一个单独的平台,同时也存在于拟合模型平台的分析方法特质中。在这两种情况下,它执行与“以 X 拟合 Y”平台中类似的检验,如表 24.1 中所示。将响应筛选作为特质使用时,它针对各个模型效应执行响应检验。

为了帮助和支持多个统计推断的分析,“响应筛选”提供以下功能:

数据表

结果显示在数据表和报表中,这样您可以探索、排序、搜索您的结果并进行绘图。同时提供便于解释图的统计量,如 p 值的 LogWorth (-log10(p 值))。

假发现率

因为您执行的检验很多,需要控制将检验判定为显著的总比率。响应筛选可控制假发现率。假发现率 (FDR) 是显著检验被错误地声明为显著的期望比例(Benjamini and Hochberg 1995;Westfall et al. 2011)。

实际显著性的检验

当您的数据表包含很多行(n 很大)时,检验中使用的标准误差会很小。因此,检验可能在统计上是显著的,但实际上观测到的差值太小,没有实效性影响。要解决该问题,您可以定义一个视为具有实际显著性的效应大小。然后便可执行实际显著性的检验,因此只检测足够大到有实际影响的效应。

等价性检验

研究很多因子时,您通常关注那些对响应具有基本同等影响的因子。在这种情况下,您可以指定达到实际等价性时的效应大小,然后执行等价性检验。

为了解决处理零乱数据引起的问题,“响应筛选”提供了处理离群值和缺失数据的功能。使用这些功能,您可以直接分析数据,而不必先解决数据质量问题:

稳健估计

您数据中的离群值会增大标准误差的估计值,导致检验对真实效应不敏感。选择“稳健”选项来执行 Huber M 估计,这样离群值仍在数据中,但是可降低检验对这些离群值的敏感度。

缺失值选项

该平台包含一个选项来以信息性方式处理分类预测变量中的缺失值。

表 24.1 响应筛选执行的分析

响应

因子

“以 X 拟合 Y”分析

说明

连续

分类

单因子

方差分析

连续

连续

二元

简单线性回归

分类

分类

列联

卡方

分类

连续

Logistic

简单 Logistic 回归

“响应筛选”平台生成图部分和报表部分。默认显示“FDR p 值”图和“结果表”。“响应筛选”特质生成一个报表,其中包含“效应检验”表、“效应的 FDR p 值图”和“FDR LogWorth 依据: 效应大小”图。

JSL 命令 Summarize YbyX 执行与“响应筛选”平台相同的功能,但是不创建平台窗口。请参见《JSL Syntax Reference》中的Summarize YByX(X(<x columns>, Y (<y columns>), Group(<grouping columns>), Freq(<freq column>), Weight(<weight column>))

需要更多信息?有问题?从 JMP 用户社区得到解答 (community.jmp.com).