我正在为我的项目浏览 Twitter 网页。发现了这个问题。
例如
网页:https
://twitter.com/SrBachchan
页面源(在浏览器中通过右键单击查看时):
查看源:https ://twitter.com/SrBachchan
通过 curl 命令下载源代码。下载的源代码(通过 curl)与原始源代码不同。
我也尝试使用 python 下载源代码(使用 urllib2.urlopen)。它与 curl 获得的相同。
任何人都可以对此有所了解。
我正在为我的项目浏览 Twitter 网页。发现了这个问题。
例如
网页:https
://twitter.com/SrBachchan
页面源(在浏览器中通过右键单击查看时):
查看源:https ://twitter.com/SrBachchan
通过 curl 命令下载源代码。下载的源代码(通过 curl)与原始源代码不同。
我也尝试使用 python 下载源代码(使用 urllib2.urlopen)。它与 curl 获得的相同。
任何人都可以对此有所了解。
我自己找到了解决方案。需要添加标题 '--header "Accept-Language: en" ' 以获得该语言的确切源代码。
例如 curl --header "Accept-Language: en" https://twitter.com/SrBachchan 会完成这项工作。