nlp - UIMA RUTA 中的匹配问题？

问问题

问问题 2015-09-05T14:07:42.613

88 次

我有很多这样的文字：

(((((WORD1 一些文本标记A)))))

(((((WORD2 一些文字记号A)))))

(((((WORD3 Some text tokenB)))))

等等。

我只需要匹配“WORD№”块。我尝试一些这样的代码：

ANY[5,5]{REGEXP("(") -> MARK(Begin)};

ANY[5,5]{REGEXP(")") -> MARK(End)};

Begin ANY+? {-> MARK(WordB)} tokenB;

但它标记了从第一个开始到第一个令牌A的所有文本。我怎样才能只标记 WORDB ？

===========

我有很多这样的文字：

)))))WORD tokenA. A lot of text. 
(((((
)))))WORD tokenB. A lot of text. 
(((((
)))))WORD tokenC. A lot of text. 
(((((
)))))WORD tokenA. A lot of text. 
(((((

等等，有很多不同的单词和很多不同的标记。我需要的？我需要用标签标记每个单词。

我的代码：

DECLARE Begin, End, tokenA, wordA;

ANY[5,5]{REGEXP(">") -> MARK(Begin)};
ANY[5,5]{REGEXP("<") -> MARK(End)};
W{REGEXP("tokena") -> MARK(tokenA)};
Begin ANY+? {-> MARK(wordA)} tokenA;

我的错误： http: //postimg.org/image/9rudzlz7j/

===========================

谢谢你，“和 ANY+？通配符“#””对我来说就像一个魅力！

nlp - UIMA RUTA 中的匹配问题？

0 回答 0

Related

Reference