斯坦福时间标记器在大多数情况下都可以正常工作。例如“我明天应该在 9 点之前到学校。” 时间是 9 点。但是 SUTime 没有识别它:(
所以我想在此基础上添加规则。有什么建议么 ?
我正在使用这个
斯坦福时间标记器在大多数情况下都可以正常工作。例如“我明天应该在 9 点之前到学校。” 时间是 9 点。但是 SUTime 没有识别它:(
所以我想在此基础上添加规则。有什么建议么 ?
我正在使用这个
我在“9 点钟”规则的正下方添加了这条规则:
{ ( (?: /the/ /hour/ /of/?)? ([ $INT & { numcompvalue<=24 } ]) (/'/ /o/ /clock/)) => IsoTime($1[0].numcompvalue, 0, NIL) }
在:
edu/stanford/nlp/models/sutime/english.sutime.txt
并且能够识别您描述的模式。
请注意,tokenizer 将 "9'o clock" 拆分为 ["9", "'", "o", "clock"]。
通常,如果您向该文件添加规则,您可以为您希望涵盖的案例添加自定义模式。该文件可以在这个 jar 中找到:
stanford-corenlp-3.5.2-models.jar