将文档词条矩阵的堆叠形式保存到 JMP 数据表。堆叠形式适用于“关联分析”平台中的分析。详细信息,请参见《预测和专业建模》手册中的“关联分析”。若您在“文本分析器”启动窗口中指定 ID 变量,可使用该 ID 变量标识每个词条来自原始文本数据表中的哪一行。堆叠的表还包含一个用于启动“关联分析”的表脚本。
将向量值公式列保存到数据表。向量的长度取决于用户指定的“最大词条数”、“最小词条频数”和“权重”选项。生成的列使用 Text Score() JSL 函数。有关该函数的详细信息,请参见“帮助”>“脚本索引”。
TF = 文档中的词条频数
nDoc = 语料库中的文档数
nDocTerm = 包含词条的文档数