我正在围绕包括 Microsoft Word Docs、PowerPoints、PDF 和文本文件在内的文档语料库构建搜索引擎。我已经成功下载并安装了 ElasticSearch 并让它运行(从命令提示符和浏览器中可见 - localhost:9200)。
我可以上传和搜索手动输入的数据(在几个在线教程中找到 - 例如这个:http ://www.elasticsearchtutorial.com/elasticsearch-in-5-minutes.html#Indexing )
现在我需要进行(大?)从搜索手动输入的数据到搜索大型结构化文本文件的语料库。我的问题是 - 我如何上传/索引这些文档以使它们可用于我已经运行的 Elasticsearch 实例。
我知道这可能太大而无法在单个回复中回答 - 即使指向工具或教程链接也会有所帮助。
版本:Windows 7、Elasticsearch 1.2.1