基本分析 > 分布 > “分布”报表 > “汇总统计量”报表
发布日期: 08/07/2020

“汇总统计量”报表

对于连续变量,“汇总统计量”报表显示均值、标准差和其他汇总统计量。通过从“汇总统计量”旁边的红色小三角菜单中选择定制汇总统计量,您可以控制在该报表中显示哪些统计量。

提示:您可以指定每次为连续变量运行“分布”分析时显示在报表中的汇总统计量。选择文件 > 首选项 > 平台 > 分布汇总统计量,然后选择您希望显示的汇总统计量。

“汇总统计量”报表的说明 说明了默认显示的统计量。

附加汇总统计量 说明了您可以使用定制汇总统计量窗口向报表添加的其他统计量。

“汇总统计量”报表的说明

均值

估计响应变量所基于的分布的预期值,是该列值的算术平均值。它是非缺失值总和除以非缺失值个数所得的值。

标准差

正态分布主要由均值和标准差来定义。这些参数可在样本变大时很容易地汇总数据:

68% 的值位于均值的一个标准差内

95% 的值位于均值的两个标准差内

99.7% 的值位于均值的三个标准差内

均值标准误差

均值的标准误差,用来估计均值分布的标准差。

均值置信上限和置信下限

均值的 95% 置信限。定义一个极可能包含真正的总体均值的区间。

数目

非缺失值的总数。

附加汇总统计量

权重和

在启动窗口中分配至“权重”角色的列的总和。“权重和”代替数目用作均值计算的分母。

总和

响应值的总和。

方差

样本方差,样本标准差的平方。

偏度

测量偏离或对称程度。

峰度

测量峰尖程度或尾重。有关公式的详细信息,请参见峰度

变异系数

变异的百分比系数。由标准差除以均值再乘以 100 计算得出。变异系数可用于评估相对变异。例如,用于比较以不同单位或不同量级测量的数据中的变异。

缺失值个数

缺失观测的个数。

零值数

零值的个数。

唯一值数

唯一值的个数。

未校正平方和

未校正的平方和,即值的平方和。

校正平方和

已校正的平方和,即均值偏差的平方和。

自相关性

(仅当未指定“频数”变量时才显示。)一阶自相关性检验行间的残差是否相关。该检验可帮助检测数据中的非随机性。

最小值

代表数据的第 0 百分位数。

最大值

代表数据的第 100 百分位数。

中位数

代表数据的第 50 百分位数。

众数

数据中出现次数最多的值。若有多个众数,则显示最小的众数。

切尾均值

删除最小的 p% 和最大的 p% 数据后计算出的均值。在该窗口底部的输入切尾均值百分比文本框中输入 p 的值。若您指定了“权重”变量,则“切尾均值”选项不可用。

几何均值

数据的积的第 n 个根。例如,几何均值通常用于计算利率。当数据包含偏斜分布中的较大值时,该统计量也很有用。

注意:负值生成缺失数字,零值(无负值)生成零。

极差

最大和最小数据之间的差值。

四分位间距

第三和第一四分位数之间的差值。

绝对偏差中位数

(若指定了“权重”变量则不显示。)相对中位数的绝对偏差的中位数。

零比例

等于零的非缺失值的比例。

非零比例

不等于零的非缺失值的比例。

稳健均值

使用 Huber M 估计以不受离群值影响的方式计算的稳健均值。请参见 Huber and Ronchetti (2009)。

稳健标准差

使用 Huber M 估计以不受离群值影响的方式计算的稳健标准差。请参见 Huber and Ronchetti (2009)。

为均值置信区间输入 (1-alpha)

指定均值置信区间的 alpha 水平。

输入切尾均值百分比

指定切尾均值百分比。将从数据两侧切除该百分比的数据。

“汇总统计量”选项

“汇总统计量”旁边的红色小三角菜单包含以下选项:

定制汇总统计量

从列表中选择要显示的统计量。您可以选择或取消选择所有汇总统计量。

显示所有众数

若有多个众数,则显示所有众数。

有关统计详细信息,请参见汇总统计量

需要更多信息?有问题?从 JMP 用户社区得到解答 (community.jmp.com).