在我看来,Parsey 在正确标记问题和任何带有“is”的句子方面存在严重问题。
文本:巴拉克奥巴马是夏威夷人吗?
GCloud 代币(正确):
- 是 - [根] 动词
- 兵营 - [nn] 名词
- 奥巴马 - [nsubj] 名词
- 来自 - [adp] 准备
- 夏威夷 - [pobj] 名词
Parsey 令牌(错误):
- 是 - [警察] 动词
- 兵营 - [nsubj] 名词
- Obama - [词根] 名词
- 来自 - [adp] 准备
- 夏威夷 - [pobj] 名词
Parsey 决定将名词 (!) Obama 设为词根,这将其他一切都搞砸了。
文字:我的名字是菲利普
GCloud 代币(正确):
- 我的 [poss] 代号
- 名称 [nsubj] 名词
- 是 [根] 动词
- Philipp [attr] 名词
ParseyTokens(不正确):
- 我的 [poss] 代号
- 名称 [nsubj] 名词
- 是 [警察] 动词
- Philipp [词根] 名词
parsey 再次选择名词作为词根并与 COP 斗争。
任何想法为什么会发生这种情况以及我该如何解决?
谢谢,菲尔