0

我正在为斯特拉斯堡的 CDS 开发一个自然语言搜索引擎。(斯特拉斯堡天文数据中心)

我想知道斯坦福词性标记器是如何标记首字母缩略词的,因为首字母缩略词有时被标记为 NNP,有时被标记为 NN。

我无法准确找到程序如何决定像“CDS”或“NASA”这样的首字母缩写词是 NNP 还是 NN。

如果有人可以在这个问题上帮助我,我会很高兴。:)

祝你有美好的一天。

4

1 回答 1

0

POS 标注器是一种统计模型,它在华尔街日报的数千个句子上进行了训练。它可能受到诸如单词中出现什么字符序列以及句子中单词周围的单词等因素的影响。

这里有更多详细信息:https ://nlp.stanford.edu/software/tagger.shtml

于 2017-05-11T21:30:26.540 回答