stanford-nlp - 如何自定义 Stanford Classifier 以获得流水线执行方式？

Question

我正在使用斯坦福 NLP 分类器，并且非常了解如何使用命令行和通过 ClassifierDemo.java 以编程方式运行，ClassifierDemo.java 是 stanford 在下载文件中提供的示例文件。我也非常了解在程序作为输入的配置/属性文件中设置所有必要的参数。有了这些知识，我只是想知道我是否可以满足以下场景。

我只知道 stanford nlp 分类器执行诸如词干提取、词形还原、pos 标记器、NER、基于正则表达式的拆分词、标记化、特征向量的构建、为每个单独的特征分配权重等操作。我只是在寻找一种管道方式来处理所有这些操作。也就是说，将一个步骤输出作为下一步的输入，直到生成最终输出。此外，我知道在 pdf 讲义和斯坦福分类器的 wiki 页面中找到了足够的解释，并亲自尝试在属性/配置文件中使用 printTo，但这仍然不足以满足我的需要。

简而言之，寻找一种管道内衬的工作方式，这样我需要在每个单独的操作之后获得输出，并再次将相同的文件作为输入提供给下一个操作。尽管随包一起提供了 java 文档，但 stanford 目前的下载中没有提供源代码。也有可能在每个操作之后生成输出，如词形还原、词干提取、pos 标记器、NER、基于正则表达式的拆分词、标记化、特征向量的构建、为每个单独的特征分配权重、建立类模型...... ETC..

stanford-nlp - 如何自定义 Stanford Classifier 以获得流水线执行方式？

0 回答 0

Related

Reference