Find centralized, trusted content and collaborate around the technologies you use most.
Teams
Q&A for work
Connect and share knowledge within a single location that is structured and easy to search.
我有一个名为 main_text 的字段,其中包含一个大文本条目。
我想通过创建一个新集合来重新索引我的数据,但我想将此字段中的所有电子邮件地址提取到名为 emails_fields 的新特殊字段中。
最好的方法是什么?
使用什么处理程序?迪赫?其他 ?这个新字段应该是什么类型?
要使用 DataImportHandler,您应该在文件中添加类似于以下内容的内容data-config.xml。
data-config.xml
<field column="email_fields" regex="(/S+@/S+)" sourceColName="main_text"/>
这将查找与 regex 匹配的电子邮件地址/S+@/S+。应该将此正则表达式更改为更好的东西以供实际使用。
/S+@/S+
该字段的类型取决于您要如何搜索它,但它可能应该是,string或者text_general如果您希望每个文档中有多个电子邮件,则它应该是多值的。
string
text_general