早上好,
我正在为我的应用程序使用斯坦福的词性,我需要解析许多文本文件(可以转到 20 个文件)。但是我注意到 stanford 需要很多时间(有时 30 分钟或更长时间),问题是 Stanford 会自动构建语法树,即使我不需要它。有没有人遇到过这个问题?我能做些什么来减少斯坦福的解析时间?
欢迎任何帮助,问候。
早上好,
我正在为我的应用程序使用斯坦福的词性,我需要解析许多文本文件(可以转到 20 个文件)。但是我注意到 stanford 需要很多时间(有时 30 分钟或更长时间),问题是 Stanford 会自动构建语法树,即使我不需要它。有没有人遇到过这个问题?我能做些什么来减少斯坦福的解析时间?
欢迎任何帮助,问候。
如果您只想要词性而不是解析树,则应该运行(序列模型)词性标注器,例如Stanford POS Tagger,它的速度要快几个数量级)。请参阅斯坦福解析器常见问题解答。(如果您想要快速标记,请使用 left3words-wsj-0-18.tagger
Stanford POS Tagger 的模型。)