3

我正在使用斯坦福 NLP 分类器,并且非常了解如何使用命令行和通过 ClassifierDemo.java 以编程方式运行,ClassifierDemo.java 是 stanford 在下载文件中提供的示例文件。我也非常了解在程序作为输入的配置/属性文件中设置所有必要的参数。有了这些知识,我只是想知道我是否可以满足以下场景。

我只知道 stanford nlp 分类器执行诸如词干提取、词形还原、pos 标记器、NER、基于正则表达式的拆分词、标记化、特征向量的构建、为每个单独的特征分配权重等操作。我只是在寻找一种管道方式来处理所有这些操作。也就是说,将一个步骤输出作为下一步的输入,直到生成最终输出。此外,我知道在 pdf 讲义和斯坦福分类器的 wiki 页面中找到了足够的解释,并亲自尝试在属性/配置文件中使用 printTo,但这仍然不足以满足我的需要。

简而言之,寻找一种管道内衬的工作方式,这样我需要在每个单独的操作之后获得输出,并再次将相同的文件作为输入提供给下一个操作。尽管随包一起提供了 java 文档,但 stanford 目前的下载中没有提供源代码。也有可能在每个操作之后生成输出,如词形还原、词干提取、pos 标记器、NER、基于正则表达式的拆分词、标记化、特征向量的构建、为每个单独的特征分配权重、建立类模型...... ETC..

4

0 回答 0