0

我让 FSCrawler 在 DEV 框中工作,其中文档与 FSCrawler 和 ElasticSearch 位于同一服务器上。在 _settings.json 文件中,我只是将 url 设置为我的文档位置,格式为“D:\MyDocs”

现在我将 elasticsearch 和 fscrawler 移动到新服务器上,并将文档放置到单独的服务器上。我现在应该如何格式化 _settings.json 文件中 url 的值?

所以我有(每个都是不同的服务器)1. WebServer,2. 文档服务器,3. 搜索服务器

elasticsearch 和 fscrawler 在服务器 3 上。

我可以将网络驱动器从服务器 2 映射到服务器 3,然后按上述方式进行映射,或者我可以在网络服务器上的 iis 中创建一个指向文档服务器的网站,然后使用http://mydocsite/ ..... ...,

我真的不想映射网络驱动器,也不想通过站点公开文档服务器。有没有更好的方法来做到这一点?

4

1 回答 1

1

您可以按照 fscrawler 文档中的说明使用 SSH 连接到文档服务器。这将让您直接索引文档服务器中的文件。您可以对 settings.json 进行以下更改

{
  "name" : "test",
  "fs" : {
    "url" : "/path/to/data/dir/on/server"
  },
  "server" : {
    "hostname" : "mynode.mydomain.com",
    "port" : 22,
    "username" : "username",
    "password" : "password",
    "protocol" : "ssh"
  }
}
于 2018-04-22T05:29:57.063 回答