支持向量机 (SVM) 模型是一种监督学习算法,用于对二值和分类响应数据进行分类。基于响应已知的一组训练数据拟合模型。然后,该模型用于预测新观测的类别。
SVM 模型通过优化用于分离类的超平面来对数据进行分类。这也可以看作是找到最大化类之间边距的超平面。在简单的问题中,这个超平面是线性的。然而,更复杂的数据往往无法线性分离。对于这些情形,SVM 平台提供了使用径向基函数内核将点映射到非线性维度的选项,这样可以使类更容易分离。
SVM 算法的最大化是通过求解二次规划问题来实现的。在 JMP Pro 中,SVM 平台使用的算法基于 John Platt 于 1998 年提出的序列最小优化 (SMO) 算法。通常,SVM 二次规划问题非常大。SMO 算法将整体二次规划问题分解为一系列较小的二次规划问题。较小的二次规划问题是解析解而不是数值解,这意味着它们生成闭式解。因此,SMO 算法比求解整体二次规划问题更有效 (Platt 1998)。