本节包含在 JMP 中实现 SOM 的步骤。
• 初始聚类种子采用可为多维空间提供良好覆盖率的方式进行选择。JMP 使用主成分来确定两个方向,用来捕获数据中的大多数变异。
• 随后,JMP 在这个主成分空间中展开一个网格,网格边缘与每个方向的中心相距 2.5 个标准差。通过将该网格转换回变量初始空间来确定聚类种子。
• 按照 K-均值方法那样继续聚类分配,将每个点分配给最靠近它的聚类。
• 像使用 k 均值方法那样为每个聚类估计均值。JMP 随后使用这些均值设置加权回归,它将每个变量设置为回归中的响应,并将 SOM 网格坐标设置为回归变量。权重函数使用核心函数将较大权重分配给要估计其中心的聚类,将较小权重分配给 SOM 网格中距离该聚类较远的聚类。新聚类均值是从该回归得到的预测值。
• 这些迭代继续执行,直到该过程收敛。