我正在使用 fasttext 将患者的医学文本注释与入院决定(分类)相关联。这类似于情绪分析。我得到了不错的准确性。但是,我也有结构化的定量数据,我想利用这些数据进一步提高模型的准确性。计划是为每个患者的文本注释提取词向量嵌入(整个文本注释的一个向量),并将其与患者的定量数据相结合,以构建另一个性能更好的分类器。
令我惊讶的是,即使不添加定量数据,我也无法使用 fasttext 提供的词向量,使用上面学习的模型来构建另一个可以匹配 fasttext 分类模型性能的分类器。
我只是使用经过训练的 fasttext 模型和最初用于训练模型的相同文本注释来调用获取词向量函数。
难道我做错了什么?感谢任何输入。我在 R 中使用 fastTextR 包。谢谢。