0

问题的主题

例如,我想从游戏市场上刮一本书页。Google 市场提供多种语言版本,没有特定于 url 的标记。那么,我怎样才能用我需要的语言而不是随机的语言来抓取特定版本?

环境

“X射线”:“^2.2.0”
节点--版本:5.9.0 npm--
版本:3.7.3

重现步骤

尝试从游戏市场中抓取任何页面。例如: https ://play.google.com/store/books/details/Walter_Isaacson_Steve_Jobs?id=I6R8MXStPXgC

预期行为

页面被特定语言抓取

实际行为

它抓取随机语言(瑞典语、西班牙语、葡萄牙语——所有这一切都是在我从同一个 VPS 运行 X 射线时)

4

1 回答 1

0

您可以使用查询字符串参数“hl”来定义两个字母的语言代码。因此,例如要获取中文页面,请使用 url:

https://play.google.com/store/books/details/Walter_Isaacson_Steve_Jobs?id=I6R8MXStPXgC&hl=zh

请注意附加到原始网址的&hl=zh 。

于 2016-08-25T09:29:10.480 回答