0

我对 Elastic Stack 很陌生,想使用 FSCrawler 来索引文档。我遇到了一个奇怪的问题:

我创建了一个新作业并确认它已成功创建。我可以看到带有作业名的新创建的文件夹。

问题是,FSCrawler 不知何故找不到新生成的工作。

我在 PS 中使用以下命令生成作业:

PS C:\ELK\fscrawler> bin/fscrawler testJobLaaKii
10:22:28,708 INFO  [f.p.e.c.f.c.BootstrapChecks] Memory [Free/Total=Percent]: HEAP [8.4mb/247.5mb=3.43%], RAM [2.4gb/7.8gb=31.33%], Swap [4.6gb/12.5gb=37.33%].
10:22:28,724 WARN  [f.p.e.c.f.c.FsCrawlerCli] job [testJobLaaKii] does not exist
10:22:28,726 INFO  [f.p.e.c.f.c.FsCrawlerCli] Do you want to create it (Y/N)?
y
10:22:31,190 INFO  [f.p.e.c.f.c.FsCrawlerCli] Settings have been created in [C:\Users\<username>\.fscrawler\testJobLaaKii\_settings.yaml]. Please review and edit before relaunch

但是每当我想启动它时,似乎 FSCrawler 都找不到它。

PS C:\ELK\fscrawler> bin/fscrawler
10:24:49,361 INFO  [f.p.e.c.f.c.BootstrapChecks] Memory [Free/Total=Percent]: HEAP [8.6mb/247.5mb=3.48%], RAM [2.4gb/7.8gb=31.38%], Swap [4.6gb/12.5gb=37.06%].
10:24:49,373 INFO  [f.p.e.c.f.c.FsCrawlerCli] No job specified. Here is the list of existing jobs:
10:24:49,378 INFO  [f.p.e.c.f.c.FsCrawlerCli] No job exists in [C:\Users\<username>\.fscrawler].
10:24:49,378 INFO  [f.p.e.c.f.c.FsCrawlerCli] To create your first job, run 'fscrawler job_name' with 'job_name' you want

即使该工作已明确创建:

具有新生成作业的文件系统

4

1 回答 1

0

Sooo,在找到这个视频后:使用 Elasticsearch 为全文搜索索引许多 PDF 文件

我使用他在视频中显示的命令解决了这个问题:

bin\fscrawler --config_dir ./DS data_science --loop 1

而不是我的较短版本。我不知道使用较短版本有什么问题,我仍然看不到我在执行时列出的作业,bin\fscrawl但它以某种方式工作......

于 2020-02-11T11:10:17.007 回答