uima - UIMA Ruta：不能使用 MarkTable 忽略句点

翻译自：https://stackoverflow.com/questions/26630441 2014-10-29T12:31:58.687

154 次

如果我有一本包含各种首字母缩写词和名称的字典，理想情况下，我希望能够避免每个“USA”、“USA”和“usa”都有条目。我可以毫不费力地忽略大小写，但忽略字符的论点似乎并不能全面发挥作用。在适当的导入和声明语句之后，我得到如下内容：

Document{->MARKTABLE(Acroynm,1,AcronymDict,true,0,".,-",10,"expandedForm"=2)};

它成功地忽略了一组 1-10 个连字符。它不会忽略整个单词中间隔的 10 个连字符。（它会忽略 a-bc 和 a--bc 但不会忽略 abc。）这对于连字符来说实际上很好，但我不能用上面的语句让它完全忽略句点。（它既不忽略 a.bc 也不忽略 abc）此外，如果我可以让它忽略句点，有什么方法可以忽略 ABC 中的句点而不仅仅是 A.BC 中的句点？

对这一论点的限制的任何进一步描述都是有用的。谢谢。

uima - UIMA Ruta：不能使用 MarkTable 忽略句点

0 回答 0

Related

Reference