利用定制设计器设计一个实验,调查葡萄酒加工因子对葡萄酒口感的影响。您的雇主种植了两种黑皮诺葡萄,可采用不同方式加工这两种葡萄。您的目标就是确定哪些因子影响黑皮诺葡萄酒的口感。在加工葡萄之前,您需要创建实验设计。加工之后,葡萄酒样本将陈酿 12 个月,然后过滤并装瓶。届时,专业品酒师会对葡萄酒样本的质量进行评级。
酒庄多数产品都会出售给五大葡萄酒分销商。您需要安排每个分销商派一名专业品酒师对葡萄酒样本的质量进行评级。为了让您可以研究的因子数最大化,您决定每名专家必须品尝八个不同的样本。这意味着您的设计需要包含 40 个葡萄酒样本或试验。
评级以 0 – 20 为尺度,其中 0 表示最差,20 表示最佳。分级,该变量包含专家的评级,是关注的响应。您想要确定将该响应最大化的葡萄酒相关因子。
分区组因子用于解释不一定直接关注的变异。若在某一因子水平上所取的观测要比在不同水平上的观测更加相似,此时分区组因子尤其有效。在您的实验中,某一位专家给出的评级很可能具有相似的特征,而与其他专家给出的评级会有差别。但是,您关注的是葡萄酒的哪些属性导致所有专家都给出高评级。
由于每个评级员都品尝了八种葡萄酒,评级员成为分区组因子,每个区组八次试验。对于该实验,只需要考虑这五个评级员。您并不想让更多的评级员参与进来。
您已经确定该项研究涉及九个过程因子。这些因子包括葡萄品种、葡萄产地,以及其他七个与加工相关的因子。您可以使用这些因子的任意组合进行实验。同样,可以在实验过程中按需更改这些因子。相对于本次实验,这些因子全部为“容易”更改。有关指定因子更改的信息,请参见更改和随机区组。
因子及其水平显示在表 4.1 中。请注意,所有这些因子都为分类因子。Sample Data 的 Design Experiment 文件夹的因子表 Wine Factors.jmp 中同样给出了这些因子及其水平。
要使用这些因子的所有可能组合进行实验,需要执行多达 4 x 28 = 1024 次试验。不过在本例中,只需 40 次试验就可以构建令人满意的设计。
因子 |
水平 |
---|---|
品种 |
Bernard,Dijon |
产地 |
1,2,3,4 |
除梗 |
No,Yes |
酵母 |
Cultured,Wild |
温度 |
High,Low |
压榨 |
Hard,Soft |
桶龄 |
New,2 Years |
桶干燥处理 |
Air,Kiln |
过滤 |
No,Yes |
既然已经定义了实验目标、因子和响应,接下来就可以构建定制设计了。
添加响应
对于这一定制设计示例,添加响应、响应“目标”以及“下限”、“上限”和“重要性”(若适用)。响应在此为分级。
1. 选择实验设计 > 定制设计。
2. 双击“响应名称”下的 Y,然后键入分级。
请注意,默认“目标”为最大化。由于您想要最大化口味等级,所以不要更改该目标。
3. 在“下限”下点击并键入 0。
最小的满意等级为 0。
4. 在“上限”下点击并键入 20。
最大的满意等级为 20。
5. 将“重要性”下面的区域留空。
由于只有一个响应,默认为该响应的“重要性”指定 1。
图 4.2 显示完成的“响应”分级显示项。
手动或自动添加因子
对于这一定制设计示例,手动输入因子,或使用包含因子和设置的预存表自动输入因子。
• 若要设计的是一个新实验,您必须首先手动输入因子。请参见手动添加因子。
• 一旦使用“保存因子”选项保存了因子,即可使用保存的表自动加载这些因子。请参见使用“加载因子”自动添加因子。
两种方法都可以将这四个分级显示项添加至“定制设计”窗口:定义因子约束、模型、别名项和生成设计。
1. 首先,添加分区组因子评级员。点击添加因子 > 分区组 > 每个区组 8 次试验。
2. 键入评级员,代替默认名称 X1。
请注意,“角色”设置为“分区组”。还请注意,只为“值”显示了一个设置。这是因为在尚未指定所需的试验次数之前无法确定区组数。一旦在“生成设计”分级显示项中指定了“试验次数”,评级员水平数即更新为所需数目。
3. 点击添加因子 > 分类 > 2 水平。
4. 键入品种,代替默认名称 X2。
请注意,“角色”已按要求设置为“分类”,“更改”默认设置为“容易”。
5. 点击 L1 和 L2,将其分别改为 Bernard 和 Dijon。
6. 点击添加因子 > 分类 > 4 水平。
7. 键入产地,代替默认名称 X3。
8. 点击 L1、L2、L3、L4,将其分别改为 1、2、3、4。
9. 点击添加因子 > 分类 > 2 水平。
10. 键入除梗,代替默认名称 X4。
11. 点击 L1 和 L2,将其分别改为 No 和 Yes。
12. 在添加因子数旁边键入 6,然后点击添加因子 > 分类 > 2 水平。这将向设计中添加六个分类两水平因子。
13. 更改默认值因子名称和值:
‒ 酵母(Cultured 和 Wild)
‒ 温度(High 和 Low)
‒ 压榨(Hard 和 Soft)
‒ 桶龄(New 和 Two Years)
‒ 桶干燥处理(Air 和 Kiln)
‒ 过滤(No 和 Yes)
图 4.2 已完成的“响应”和“因子”分级显示项
14. 点击继续。
以下分级显示项将添加到“定制设计”窗口:
• 定义因子约束(本例未使用)
• 模型
• 别名项
• 生成设计
使用包含因子信息的表输入因子:
1. 选择帮助 > 样本数据库,然后打开 Design Experiment/Wine Factors.jmp。
2. 点击“定制设计”红色小三角并选择加载因子。
加载因子之后,“定制设计”窗口自动更新。以下分级显示项将添加到“定制设计”窗口:
• 定义因子约束(本例未使用)
• 模型
• 别名项
• 生成设计
定义模型
对于这一定制设计示例,“模型”分级显示项将所有主效应显示为“必需”,指示该设计需能够估计所有主效应。您的假设模型反映您仅关注主效应。但是,若您想要估计其他效应,则可以将其添加至“模型”分级显示项。有关模型的详细信息,请参见模型。
图 4.3 “模型”分级显示项
定义别名项
“别名项”分级显示项指定要显示在之后出现的“别名矩阵”中的效应。“别名矩阵”显示模型项与“别名项”分级显示项所列的效应之间的别名关系。打开“别名项”分级显示节点以验证是否已列出所有双因子交互作用。有关别名矩阵的详细信息,请参见别名矩阵。
图 4.4 “别名项”分级显示项的部分视图
设置随机种子以复制设计
“定制设计”算法以随机开始设计开头。要复制本例或教学设置中的设计,请设置用于定义开始设计的随机种子。若想获得包含与图 4.5 中所示完全相同的试验和试验顺序的设计,请设置随机种子和开始数:
1. 点击“定制设计”红色小三角并选择设置随机种子。
2. 键入 100526291(随机种子)。
3. 点击确定。
4. 点击“定制设计”红色小三角并选择开始数。
5. 键入 2。
6. 点击确定。
注意:设置“随机种子”和“开始数”将精确重现本例中显示的结果。自行构造设计时,这些步骤不是必需的。
生成设计
在“生成设计”分级显示项中,您可以输入有关设计的结构和大小的其他详细信息。在本例中,默认设计显示 16 次试验。但您有五位评级员,每一位可以抽取八种葡萄酒的样本。这意味着您的设计包含 40 次试验。更改设计试验次数:
1. 在试验次数下的用户指定框中键入 40。
由于您不想重复试验,请保持重复试验次数设置为 0。
2. 点击制作设计。
“设计”和“设计评估”分级显示项将添加到“定制设计”窗口中。“输出选项”面板也会显示出来。
验证设计
“设计”分级显示项显示您已经构造的定制设计中的试验。您随后可以在“输出选项”中随机安排试验顺序。当前需要确认该设计是否适合您的实验。例如,确认每一位评级员(共五位)各评估八种葡萄酒,所有必需因子都显示出来,没有任何设置代表不可行的组合。
图 4.5 葡萄酒实验设计
评估设计
“设计评估”分级显示项提供多种评估定制设计的方法。对于本例,打开“设计评估”分级显示项,检查“相关性色图”、“别名矩阵”和“设计诊断”。
注意:有关“设计评估”分级显示项的详细信息,请参见评估设计。
“相关性色图”显示“模型”或“别名项”分级显示项中显示的任意两个效应之间的相关性绝对值。
图 4.6 相关性色图
主效应由色图左上角的 15 个项表示。白色表示的主效应与其他主效应之间的相关性为 0。这意味着所有主效应都是正交的,可以独立进行估计。
图 4.6 中唯一的黑色位于主对角线上。黑色指示绝对相关性为 1,它反映出每个项都与其自身完全相关。由此断定没有任何主效应与任何双因子交互作用完全混杂。事实上,主效应与双因子交互作用相关性的绝对值相当低。这意味着主效应估计值因为存在活跃的双因子交互作用而只产生轻微的偏倚。
提示:悬停在色图中的单元格上方可查看效应之间的绝对相关性。在图例下右击,将相关性保存至数据表。
在“别名矩阵”中,模型效应列在左侧列中。对于给定的模型效应,列条目将指明列效应(若活跃)使模型效应估计值产生偏倚的程度。
图 4.7 别名矩阵的部分视图
例如,考虑模型效应桶干燥处理。若品种*压榨活跃,则桶干燥处理效应的期望估计值不同于该效应的无偏估计值。其差值是品种*压榨效应的 0.4 倍。因此,看起来显著的桶干燥处理估计效应实际上可能是显著的品种*压榨效应。
“设计诊断”分级显示项提供有关设计效率的信息。效率测度将您的设计与可能并不存在的理论最优设计加以对比。效率值是您设计的效率与该最优设计的效率之比,表示为百分比。有关效率测度的详细信息,请参见估计效率。
图 4.8 “设计诊断”分级显示项
请注意,D、G 和 A 效率值均为 100%。由于您的设计对主效应是正交的,所以相对于全部三种效率准则,该设计对主效应模型是最优的。
“设计诊断”分级显示项的第一行指示构造设计是为优化 D 效率准则。请参见定制设计选项中的“最优性准则”说明。在这种情况下,您的设计具有 100% 的 D 效率。
指定设计表选项
定制设计生成过程的最后步骤是为设计表指定选项并生成表。使用“输出选项”面板指定数据表中的试验顺序。默认选择区组内随机即为适合本例的选项。只需点击制表。
一个定制设计表随即创建并打开,该表类似于图 4.9 中的表。
注意:您的表可能看起来有所不同,因为创建它的算法使用随机开始设计。要获得图 4.9 中所示的精确表,请按设置随机种子以复制设计中所述设置随机种子和开始数。
图 4.9 定制设计表
请注意以下几点:
• 在“表”面板中,设计创建过程中会添加“模型”脚本、“评估设计”脚本和“实验设计对话框”脚本。使用“模型”脚本可打开“拟合模型”窗口,其中包含您在“定制设计”对话框窗口中指定为“必需”的效应。“实验设计对话框”脚本可重新创建用于生成设计表的窗口。
• 在“列”面板中,因子和响应右侧的星号指示列属性已保存至数据表中的列。这些列属性用在数据分析中。有关列属性的详细信息,请参见因子和因子列属性。
分析定制设计
在运行实验和收集数据之后,您就可以分析结果了。使用“定制设计”表的分级列记录分级数据。
1. 选择帮助 > 样本数据库,然后打开 Design Experiment/Wine Data.jmp。
Wine Data.jmp 表与图 4.9 中所示的定制设计表完全相同,只不过其中包含您记录的实验结果。
2. 在“表”面板中,点击模型脚本旁边的绿色小三角。
图 4.10 葡萄酒实验的“模型规格”窗口
请注意,评级员分区组因子添加为固定效应,而不是随机区组效应。这样添加很合理,因为这五位评级员是专门挑选的,而不是从较大总体中随机抽取的样本。
3. 点击运行。
来自定制设计示例的模型输出显示如下。
图 4.11 部分模型拟合结果
请注意以下几点:
• “‘预测值-实际值’图”显示没有明显证据表明失拟。
• 正如“‘预测值-实际值’图”和其下的 p 值指明的那样,该模型是显著的。
• “效应检验”报表指示模型项中有七项在 0.05 水平下显著。产地、温度和桶龄不显著。
• “效应汇总”报表按照显著性从高到低列出这些效应。较大的 LogWorth 值对应于较小的 p 值和较大的显著性。
通过删除您确认为不活跃的效应来简化定制设计结果模型:
1. 在“效应汇总”报表中,按 Ctrl 键并选择温度、产地和桶龄。
2. 点击删除。
报表随之更新,以显示删除这三个效应之后的模型拟合。
使用刻画器解释模型结果
简化模型的“‘预测值-实际值’图”显示不存在失拟问题。“效应汇总”和“效应检验”报表显示其余七项在 0.05 水平下显著。使用预测刻画器可以进一步探索简化模型。
图 4.12 显示了“预测刻画器”。回想一下,您已经指定响应目标为“最大化”,下限和上限分别为 0 和 20。设置这些限值导致“响应限”列属性保存到定制设计表的分级列。“预测刻画器”使用“响应限”信息构造意愿函数,该函数显示在图 4.12 的顶行中的最右侧图内。底部行显示意愿迹线。
顶部行中的前六个图显示预测模型的迹线。对于每个因子,图中的线条显示当其他所有因子都设置为红色垂直虚线定义的值时,分级如何变化。默认情况下,刻画器中的分类因子设置为其低值设置。通过更改这些因子的设置,您可以查看葡萄酒的预测分级如何变化。请注意,已为预测分级均值指定了置信区间。
请注意,评级员并未包括在刻画器所示的因子中。这是因为评级员是一个区组变量。包括评级员是为了解释变异,但评级员与优化过程因子设置不直接相关。具有给定设置的葡萄酒的预测分级是所有评级员对该葡萄酒的预测等级的平均值。
图 4.12 简化模型的刻画器
使用预测刻画器可以基于定制设计结果标识最优设置。您希望确定可将各个评级员的分级最大化的设置。
1. 点击“预测刻画器”红色小三角并选择优化和意愿 > 最大化意愿。
“预测刻画器”中的红色垂直虚线随之更新,以显示每个因子的最优设置。最优设置导致预测分级为 19.925。通常,可能有多组不同的因子设置都会生成相同的最优值。
图 4.13 已优化因子设置的“预测刻画器”
2. 要查看所有试验的预测分级,请保存“预测公式”。点击“响应‘分级’”红色小三角并选择保存列 > 预测公式。
名为预测公式:分级的列将添加到数据表中。请注意,其中一个试验,第 33 行,得到了评级员 5 给出的最大分级 20。评级员 5 给出的该试验的预测分级为 19.550。但是第 33 行试验是以最优设置运行的。“预测刻画器”中为这些设置给出的预测值 19.925 是通过对该试验全部五位评级员的预测分级取平均值得到的。
您可以在刻画器中锁定因子来探索特定条件下的优化。将设计响应最大化时,您了解到 Dijon 品种的葡萄实现了最优分级(图 4.13)。您的经理指出在种植 Bernard 葡萄的土地上重新种植 Dijon 葡萄树幼苗在成本上不可行。因此,您需要查找 Bernard 葡萄的最优过程设置和预测分级。
1. 在“预测刻画器”的品种图中,将红色垂直虚线拖至 Bernard。
2. 按 Ctrl 键并点击品种图之一。
“因子设置”窗口随即显示。
3. 选择锁定因子设置并点击确定。
4. 点击“预测刻画器”红色小三角并选择优化和意愿 > 最大化意愿。
图 4.14 包含 Bernard 品种的最优设置的“预测刻画器”
最优设置没有变化,因为模型不包含交互作用项。在这些设置处的预测分级为 17.975。
若您想要查看评级员各水平的刻画器迹线,请执行以下步骤:
1. 点击“预测刻画器”红色小三角并选择重置因子网格。
随即显示“因子设置”窗口,其中包含所有因子(包括评级员)所对应的列。评级员下面位于显示旁边的框并未选中。这指示评级员不显示在“预测刻画器”中。
2. 选中评级员下面与显示相对应行中的框。
3. 取消选中评级员下面与锁定因子设置相对应行中的框。
4. 点击确定。
刻画器更新以显示针对评级员的图。
5. 点击评级员上方两个图中的任一个。
图 4.15 针对显示评级员的简化模型的刻画器
随即显示红色垂直虚线。拖动该线可查看每一个评级员的迹线。请记住,品种仍在 Bernard 处锁定。要解锁品种,请按 Ctrl 键并点击品种图之一。在出现的“因子设置”窗口中,取消选择锁定因子设置。
定制设计汇总示例
在葡萄酒品尝实验中,仅使用 40 次试验,就从总共九个因子中确定了六个因子对 Pinot Noir 葡萄的评级具有影响。您发现:在这些因子采用最优设置时,可以实现的预测分级为 19.925(最大可能为 20)。您还确定了两个葡萄品种的最优设置。
在本节中,您使用“定制设计”窗口中的分级显示项构造了一个设计。下一节会更详细地解释各个分级显示项和设计步骤。