我有很多这样的文字:
(((((WORD1 一些文本标记A)))))
(((((WORD2 一些文字记号A)))))
(((((WORD3 Some text tokenB)))))
等等。
我只需要匹配“WORD№”块。我尝试一些这样的代码:
ANY[5,5]{REGEXP("(") -> MARK(Begin)};
ANY[5,5]{REGEXP(")") -> MARK(End)};
Begin ANY+? {-> MARK(WordB)} tokenB;
但它标记了从第一个开始到第一个令牌A的所有文本。我怎样才能只标记 WORDB ?
===========
我有很多这样的文字:
)))))WORD tokenA. A lot of text.
(((((
)))))WORD tokenB. A lot of text.
(((((
)))))WORD tokenC. A lot of text.
(((((
)))))WORD tokenA. A lot of text.
(((((
等等,有很多不同的单词和很多不同的标记。我需要的?我需要用标签标记每个单词。
我的代码:
DECLARE Begin, End, tokenA, wordA;
ANY[5,5]{REGEXP(">") -> MARK(Begin)};
ANY[5,5]{REGEXP("<") -> MARK(End)};
W{REGEXP("tokena") -> MARK(tokenA)};
Begin ANY+? {-> MARK(wordA)} tokenA;
我的错误: http: //postimg.org/image/9rudzlz7j/
===========================
谢谢你,“和 ANY+?通配符“#””对我来说就像一个魅力!