我有一个包含 1,00,000 多个文档的训练数据集,分为大约 100 个类别。我正在尝试使用DeepLearning4java库预测文本的类别,代码基于ParagraphVectorsClassifierExample示例。每个文档都是一行短文本。
我将可用数据分为训练数据(80%)和测试数据(20%)。通过对参数进行大量调整,我对测试数据的预测正确率最高为 20%。我知道很多事情都取决于输入数据本身。但是,只是想检查一下准确性是否可以进一步提高。我在示例代码中看到一条注释,上面写着“可以通过使用学习级联来改进此示例以提高准确性”。任何提高预测准确性的提示/帮助/建议将不胜感激。