2

使用 Drupal/Search API 模块/Solr/Tika,我们正在尝试索引大量文件。

我已经设置了索引并且一切正常,直到我包含搜索 API 附件模块。

当我们运行 cron 时,tika不会被调用。我们知道这一点是因为我们在 tika 模块的末尾放入了一段 PHP 代码来写入系统日志,并且该消息永远不会出现。手动运行索引时会显示。

此外,项目数索引在 cron 运行后不会增加。

我们还注意到,如果我们从命令行运行 tika,我们会在输出顶部收到以下错误:INFO - unsupported/disabled operation: EI

该索引按预期工作,无需选中该框以在 cron 和手动索引上索引附件。

知道问题可能是什么吗?

谢谢!

网站建立在:

  • 德鲁巴 7

有问题的模块:

  • 搜索 API
  • 搜索 API 附件

索引:

  • 阿帕奇索尔

索引附件使用:

  • 蒂卡图书馆
4

1 回答 1

0

我也有同样的问题。但这似乎根本不是问题,因为文档似乎无论如何都被索引了。

我想这是一个 Tika 问题,因为有些文档(pdf)运行良好,有些则不行。也许这取决于pdf版本。尝试一些更简单的东西。IE 我写了一个示例文本,并在我的 mac 上使用 print to pdf 功能来获取一个简单的 pdf 文档。或者使用 Word 文档。我们还必须应用真实路径补丁来让 Tika 使用这些文件......并且音译模块具有干净的文件名。对于调试 search_api,我使用来自 devel 的 dd()-function。在 search_api_solr/includes/solr_httptransport.inc performHttpRequest() 我 dd($url); dd($options);之前打电话$response = drupal_http_request($url, $options);(行:92)......希望这会有所帮助。

于 2012-09-27T15:50:54.903 回答