我想在大量文档中搜索字符串。我有一个预定义的可用字符串列表,我想在每个文档中找到它们。每个文档的开头都包含一个标题,后跟文本,标题中是我想在标题下方的文本中搜索的附加字符串。
在文档的每次迭代中,是否可以在创建由主列表创建的初始树后添加标题字符串?或者修改原始数据结构以包含新字符串?
如果这不切实际,是否有更合适的替代搜索方法?
我想在大量文档中搜索字符串。我有一个预定义的可用字符串列表,我想在每个文档中找到它们。每个文档的开头都包含一个标题,后跟文本,标题中是我想在标题下方的文本中搜索的附加字符串。
在文档的每次迭代中,是否可以在创建由主列表创建的初始树后添加标题字符串?或者修改原始数据结构以包含新字符串?
如果这不切实际,是否有更合适的替代搜索方法?