-3

我是 MySQL 新手。我正在尝试使文本文档“机器可读”。我有一堆文本文档,每个文档都包含一些元数据(如作者、文档编号等)。此外,文本的不同部分被标记(如标题、介绍、引文、链接等),一些标记包含元数据(如链接参考)。

我需要能够通过元数据和文本搜索数据库。此外,我需要能够只搜索文档的不同部分(介绍等)。我还需要标记文本的新部分——添加额外的“标记”。

我可以很容易地想象如何在 xml 中表示这些文档,但是,由于我需要对这些文本执行复杂的查询,因此将它们存储在 xml 中并不是一个可行的选择。

我想找到有关如何以不会使添加附加信息(尤其是“标记”)困难的方式构造模式/表的基本指针。

希望关于我想要实现的目标的描述不会太模棱两可。非常感谢帮助。

4

1 回答 1

1

您描述的要求表明您需要的不是真正的 MySQL(或任何其他供应商)关系数据库,而是 Lucene 索引。至少那是我用来完成类似目标的(Lucene)。

由于问题不是很具体(请参阅https://stackoverflow.com/faq#questions),我会给你一个一般性的答案。

所以试试 Solr ,它是 Lucene 与 MySQL 的结合。尝试通过本教程http://lucene.apache.org/solr/api-3_6_1/doc-files/tutorial.html

于 2012-09-19T10:04:58.673 回答