通过选择分析 > 多元方法 > 多元来启动“多元”平台。
图 3.3 “多元”启动窗口
有关“选择列”红色小三角菜单中选项的详细信息,请参见《使用 JMP》中的“列过滤器”菜单。
Y,列
标识一个或多个响应列。响应列必须具有数值数据类型,但建模类型可以是连续型或有序型。
注意:若您指定有序型响应变量,则在“启动”窗口中点击“确定”后会出现 JMP 警报。该警报指示哪些变量是有序型变量,并确认您打算在分析中包含有序型变量。
权重
标识一列,该列的数值为分析中的每一行都分配一个权重。
频数
标识一列,该列的数值为分析中的每一行都分配一个频数。
依据
为“依据”变量的每个水平生成单独的报表。若分配了多个“依据”变量,则为“依据”变量水平的每个可能组合生成单独报表。
估计方法
指定计算相关性的方法。REML 和配对是最常用的方法。其中有些方法解决了缺失数据的处理。您也可以使用“逐行”以外的方法估计缺失值,然后选择“补缺缺失数据”命令。请参见补缺缺失数据。
默认
默认选项使用“逐行”、“配对”或“REML”方法。
‒ 逐行估计用于不含缺失值的数据表。
‒ 配对估计用于包含缺失值并且多于 10 列、多于 5,000 行或列数多于行数的数据表。
‒ 在其他情况下使用 REML 估计。
若“默认”选项在其他情况下导致 REML 估计,但拟合不能正确收敛,则平台转换为“配对”方法。当数据表中有缺失值且以下情形之一成立时就会出现这种情况:您的数据表少于 10 列、少于 5,000 行,或列数少于行数。若显示的估计方法为“配对”,这意味着 REML 拟合未收敛。
REML
限制最大似然 (REML) 估计使用所有数据,即使存在缺失值。由于存在偏倚修正因子,若您的数据集很大且包含许多缺失值,该方法会很慢。因此,REML 最适用于较小的数据集。若数据中不含缺失单元格,则 REML 和 ML 估计值等价于样本协方差矩阵。若存在缺失单元格,与 ML 估计相比,REML 的方差和协方差估计值的偏倚更小。有关统计详细信息,请参见REML。
ML
最大似然 (ML) 估计使用所有数据,即使存在缺失值。由于 ML 的估计值生成速度更快,该方法最适用于包含缺失数据的大数据表。
稳健
稳健估计使用所有数据,即使存在缺失值。该方法降低了极值的权重,因此最适用于可能具有离群值的数据表。有关统计详细信息,请参见稳健。
逐行
逐行估计为每对列计算 Pearson 相关性系数。有关统计详细信息,请参见Pearson 乘积矩相关系数。逐行估计不使用包含缺失值的行。该方法适用于排除具有缺失数据的观测。
配对
配对估计使用所有数据,即使存在缺失值。该估计方法使用这两列中不含缺失值的所有观测为每对列计算 Pearson 相关性系数。有关统计详细信息,请参见Pearson 乘积矩相关系数。配对估计最适用于包含缺失值并且列数多于行数、多于 10 列或多于 5,000 行的数据表。
注意:若您选择“REML”、“ML”或“稳健”,而您的数据表中的列数多于行数并且具有缺失值,JMP 会将“估计方法”切换为“配对”。
矩阵格式
选择用于“散点图矩阵”的格式选项。“方形”选项为所有排序列组合显示图。“下三角”在对角线下方显示图,前 n - 1 个列显示在水平轴上。“上三角”在对角线上方显示图,前 n - 1 个列显示在垂直轴上。