2

如果我有一本包含各种首字母缩写词和名称的字典,理想情况下,我希望能够避免每个“USA”、“USA”和“usa”都有条目。我可以毫不费力地忽略大小写,但忽略字符的论点似乎并不能全面发挥作用。在适当的导入和声明语句之后,我得到如下内容:

Document{->MARKTABLE(Acroynm,1,AcronymDict,true,0,".,-",10,"expandedForm"=2)};

它成功地忽略了一组 1-10 个连字符。它不会忽略整个单词中间隔的 10 个连字符。(它会忽略 a-bc 和 a--bc 但不会忽略 abc。)这对于连字符来说实际上很好,但我不能用上面的语句让它完全忽略句点。(它既不忽略 a.bc 也不忽略 abc)此外,如果我可以让它忽略句点,有什么方法可以忽略 ABC 中的句点而不仅仅是 A.BC 中的句点?

对这一论点的限制的任何进一步描述都是有用的。谢谢。

相关 Ruta 文档:https ://uima.apache.org/d/ruta-current/tools.ruta.book.html#ugr.tools.ruta.language.actions.marktable

4

0 回答 0