1

我有一个名为 main_text 的字段,其中包含一个大文本条目。

我想通过创建一个新集合来重新索引我的数据,但我想将此字段中的所有电子邮件地址提取到名为 emails_fields 的新特殊字段中。

最好的方法是什么?

使用什么处理程序?迪赫?其他 ?这个新字段应该是什么类型?

4

1 回答 1

0

要使用 DataImportHandler,您应该在文件中添加类似于以下内容的内容data-config.xml

<field column="email_fields" regex="(/S+@/S+)" sourceColName="main_text"/>

这将查找与 regex 匹配的电子邮件地址/S+@/S+。应该将此正则表达式更改为更好的东西以供实际使用。

该字段的类型取决于您要如何搜索它,但它可能应该是,string或者text_general如果您希望每个文档中有多个电子邮件,则它应该是多值的。

于 2014-05-08T13:36:37.790 回答