我在一个基于 Typo3 v9.5.23 的 Intranet 上进行了工作。他们使用 indexed_search v9.5.23 和 crawler v9.1.5 来爬取页面,但在我为每个页面获取tx_crawler_queue
的列中的数据库表中。result_data
{"content":"\"403 Access denied\""}
要查看您必须以前端用户身份登录的页面。我必须做什么才能抓取这些页面?
我正在使用带有以下命令的控制台:
vendor/bin/typo3 crawler:flushQueue all
vendor/bin/typo3 crawler:buildQueue 69 intranet --depth=2
vendor/bin/typo3 crawler:processQueue