对于连续变量,“汇总统计量”报表显示均值、标准差和其他汇总统计量。通过从“汇总统计量”旁边的红色小三角菜单中选择定制汇总统计量,您可以控制在该报表中显示哪些统计量。
提示:您可以指定每次为连续变量运行“分布”分析时显示在报表中的汇总统计量。选择文件 > 首选项 > 平台 > 分布汇总统计量,然后选择您希望显示的汇总统计量。
• “汇总统计量”报表的说明 说明了默认显示的统计量。
• 附加汇总统计量 说明了您可以使用定制汇总统计量窗口向报表添加的其他统计量。
均值
估计响应变量所基于的分布的预期值,是该列值的算术平均值。它是非缺失值总和除以非缺失值个数所得的值。
标准差
正态分布主要由均值和标准差来定义。这些参数可在样本变大时很容易地汇总数据:
‒ 68% 的值位于均值的一个标准差内
‒ 95% 的值位于均值的两个标准差内
‒ 99.7% 的值位于均值的三个标准差内
均值标准误差
均值的标准误差,用来估计均值分布的标准差。
均值置信上限和置信下限
均值的 95% 置信限。定义一个极可能包含真正的总体均值的区间。
数目
非缺失值的总数。
权重和
在启动窗口中分配至“权重”角色的列的总和。“权重和”代替数目用作均值计算的分母。
总和
响应值的总和。
方差
样本方差,样本标准差的平方。
偏度
测量偏离或对称程度。
峰度
测量峰尖程度或尾重。有关公式的详细信息,请参见峰度。
变异系数
变异的百分比系数。由标准差除以均值再乘以 100 计算得出。变异系数可用于评估相对变异。例如,用于比较以不同单位或不同量级测量的数据中的变异。
缺失值个数
缺失观测的个数。
零值数
零值的个数。
唯一值数
唯一值的个数。
未校正平方和
未校正的平方和,即值的平方和。
校正平方和
已校正的平方和,即均值偏差的平方和。
自相关性
(仅当未指定“频数”变量时才显示。)一阶自相关性检验行间的残差是否相关。该检验可帮助检测数据中的非随机性。
最小值
代表数据的第 0 百分位数。
最大值
代表数据的第 100 百分位数。
中位数
代表数据的第 50 百分位数。
众数
数据中出现次数最多的值。若有多个众数,则显示最小的众数。
切尾均值
删除最小的 p% 和最大的 p% 数据后计算出的均值。在该窗口底部的输入切尾均值百分比文本框中输入 p 的值。若您指定了“权重”变量,则“切尾均值”选项不可用。
几何均值
数据的积的第 n 个根。例如,几何均值通常用于计算利率。当数据包含偏斜分布中的较大值时,该统计量也很有用。
注意:负值生成缺失数字,零值(无负值)生成零。
极差
最大和最小数据之间的差值。
四分位间距
第三和第一四分位数之间的差值。
绝对偏差中位数
(若指定了“权重”变量则不显示。)相对中位数的绝对偏差的中位数。
零比例
等于零的非缺失值的比例。
非零比例
不等于零的非缺失值的比例。
稳健均值
使用 Huber M 估计以不受离群值影响的方式计算的稳健均值。请参见 Huber and Ronchetti (2009)。
稳健标准差
使用 Huber M 估计以不受离群值影响的方式计算的稳健标准差。请参见 Huber and Ronchetti (2009)。
为均值置信区间输入 (1-alpha)
指定均值置信区间的 alpha 水平。
输入切尾均值百分比
指定切尾均值百分比。将从数据两侧切除该百分比的数据。
“汇总统计量”旁边的红色小三角菜单包含以下选项:
定制汇总统计量
从列表中选择要显示的统计量。您可以选择或取消选择所有汇总统计量。
显示所有众数
若有多个众数,则显示所有众数。
有关统计详细信息,请参见汇总统计量。