所以,如果假设有这样一行:
> Mar 14 20:22:41 subdomain.mydomain.colo postfix/smtpd[16862]: NOQUEUE:
> reject: RCPT from unknown[1.2.3.4]: 450 4.7.1 Client host rejected:
> cannot find your reverse hostname, [5.6.7.8]; from=<erp@misms.net.in>
> to=<a@domain1.com> proto=ESMTP helo=<a.domain.net> also
> from=<>
使用标准标记器几乎没有问题。
- 如果我有标准标记器,我无法搜索
from=<>
. - 为此,空白标记器可以完美运行。但是,与此同时,我将无法搜索电子邮件 ID
a@domain1.com
或域a.domain.net
,因为它们包含<>
字符。我想a@domain1.com
成为一个象征 - 如果我使用标准标记器,我可以搜索,
a@domain1.com
但这些实际上是两个标记(所以我认为它效率低下)。 - 标准标记器破坏了我不想要的主机名 subdomain.mydomain.colo。
那么,有没有一种方法可以分析文本,使其使用标准标记器,但也不标记匹配正则表达式的单词?我是 ES 的新手,所以如果可能的话,请尝试举一个小例子,那会很棒。
我觉得与正则表达式相关的标记器可能很昂贵,所以如果有改变我可以做空白分析器 + 还保留主机名、电子邮件 ID 等标记并保留几个单词,那就太棒了。
请回答您有任何类型的输入。
PS:我在 ES 邮件列表中查看了这篇文章,但它不适用于电子邮件地址或主机名,因为我无法获得所有电子邮件地址/主机名的详尽列表。所以,我希望你能理解我的要求。