2

我正在尝试通过scrapinghub/splashDocker 映像使用 Splash,并在第一个请求之后发出一些警报(这是到/robots.txt端点,因为我正在使用库scrapy-splash插件scrapy(使用 Python 3.6)。

[-] "172.17.0.1" - - [18/Jan/2018:00:05:12 +0000] "GET /robots.txt HTTP/1.1" 404 153 "-" "Scrapy/1.5.0 (+https://scrapy.org)"
libpng warning: iCCP: known incorrect sRGB profile
libpng warning: iCCP: known incorrect sRGB profile
process 1: D-Bus library appears to be incorrectly set up; failed to read machine uuid: UUID file '/etc/machine-id' should contain a hex string of length 32, not length 0, with no other text
See the manual page for dbus-uuidgen to correct this issue.
qt.network.ssl: QSslSocket: cannot resolve SSLv2_client_method
qt.network.ssl: QSslSocket: cannot resolve SSLv2_server_method

最可悲的是它没有渲染这个页面。还需要提到的是,有时它会呈现这个页面,并且它包含重定向以防 JS 可用。

如何让它发挥作用?

更新

仍然使用scrapinghub/splash:3.0这些消息时,但渲染工作。那么我应该将其报告为scrapinghub/splash图像中的错误还是这些错误可能是由我的环境引起的?

更新

出于某种原因,甚至3.0从现在开始都不会渲染,以及master(docker image tag)。因此,对于每个带有latestormaster3.0标签的图像,在询问(索引端点上的表单)渲染http://floodlist.com/news页面之后,它只显示一个带有You are being redirected...标题的页面。

我发现了这个问题,所以d-bus问题可能是无害的。

4

2 回答 2

0

过程 1:D-Bus 库似乎设置不正确;无法读取机器 uuid:UUID 文件“/etc/machine-id”应包含长度为 32 的十六进制字符串,而不是长度 0,没有其他文本 请参阅 dbus-uuidgen 的手册页以更正此问题。

这些似乎是关于如何解决 D-Bus 问题的相当简洁的说明。

我不知道其他警告,或者它们中的任何一个是否相关。

于 2018-01-18T11:43:29.430 回答
0

这些警告/错误似乎是无害的(参见Splash 上的 #491scrapy-splash 上的 #122

渲染问题通过将wait值增加到 1 秒来解决。有关渲染问题的更多信息在这里

于 2018-01-20T06:02:37.027 回答