我正在尝试通过scrapinghub/splash
Docker 映像使用 Splash,并在第一个请求之后发出一些警报(这是到/robots.txt
端点,因为我正在使用库scrapy-splash
插件scrapy
(使用 Python 3.6)。
[-] "172.17.0.1" - - [18/Jan/2018:00:05:12 +0000] "GET /robots.txt HTTP/1.1" 404 153 "-" "Scrapy/1.5.0 (+https://scrapy.org)"
libpng warning: iCCP: known incorrect sRGB profile
libpng warning: iCCP: known incorrect sRGB profile
process 1: D-Bus library appears to be incorrectly set up; failed to read machine uuid: UUID file '/etc/machine-id' should contain a hex string of length 32, not length 0, with no other text
See the manual page for dbus-uuidgen to correct this issue.
qt.network.ssl: QSslSocket: cannot resolve SSLv2_client_method
qt.network.ssl: QSslSocket: cannot resolve SSLv2_server_method
最可悲的是它没有渲染这个页面。还需要提到的是,有时它会呈现这个页面,并且它包含重定向以防 JS 可用。
如何让它发挥作用?
更新
仍然使用scrapinghub/splash:3.0
这些消息时,但渲染工作。那么我应该将其报告为scrapinghub/splash
图像中的错误还是这些错误可能是由我的环境引起的?
更新
出于某种原因,甚至3.0
从现在开始都不会渲染,以及master
(docker image tag)。因此,对于每个带有latest
ormaster
或3.0
标签的图像,在询问(索引端点上的表单)渲染http://floodlist.com/news
页面之后,它只显示一个带有You are being redirected...
标题的页面。
我发现了这个问题,所以d-bus
问题可能是无害的。