1

我正在为我的网站使用indexed_search, indexed_search_mysql爬虫扩展程序。我在crawler下面创建了一个记录Crawler Configuration并运行它。这会成功爬取所有页面。

配置index_enable and index_externals设置为真

问题是所有爬取的东西都没有出现在index表格中。将info>Indexed Search所有页面显示为“未编入索引”。

indexed_search 仅在disableFrontendIndexing is set false. 但为此,我必须访问每一页。

我在这里还缺少其他配置吗?

4

2 回答 2

3

索引搜索仅索引缓存的页面。所以你可能想检查一下

config.no_cache = 1

已设置。在这种情况下,您将不会获得任何索引。您还应该在浏览您的页面之前清除所有缓存,因此必须再次缓存它们。

如果还是不行,可以试试

config.index_enable = 1

page.config.index_enable = 1

有什么不同。

于 2013-11-01T10:06:53.873 回答
1

在标准配置中,爬虫仅将要索引的页面写入队列。您必须通过“添加进程”运行它。你做了这个了吗?

在此处输入图像描述

或通过cli:

/usr/bin/php /var/www/example.com/typo3/cli_dispatch.phpsh crawler

有一个选项可以一次性完成:

/usr/bin/php /var/www/example.ch/typo3/cli_dispatch.phpsh crawler_im 597 -d 9 -conf yourconfititle -o exec

有关文档中 cli 的更多信息:

https://docs.typo3.org/typo3cms/extensions/crawler/ExtCrawler/ExecutingTheQueue/BuildingAndExecutingQueueRightAway(fromCli)/Index.html

于 2015-11-06T09:12:24.883 回答