3

我想从以下站点下载所有周日填字游戏。

http://epaper.timesofindia.com/Default/Client.asp?skin=pastissues2&enter=LowLevel

我可以手动搜索“星期日填字游戏”并获得我需要的所有结果。但结果都在 javascript 弹出窗口中打开。

http://epaper.timesofindia.com/Default/Scripting/SearchView.asp?skin=pastissues2&AppName=2&sPublication=TOIM&y=11&Content=ALL&sQuery=SUNDAY+CROSSWORD&sScope=P&x=13&ContentType=on&sSorting=IssueDateID%2Casc&sLanguage=en&Offset=1

我需要学习/使用什么 python 库来处理这样的问题?

我知道 urllib 的基础知识。可以用于此特定目的吗?

我是一个相对较新的程序员,不太了解网络技术。因此,任何关于阅读哪些资源的建议都会有所帮助。

4

1 回答 1

1

Selenium 将是一个很好的工具。由于它驱动一个真正的浏览器,它可以处理 JavaScript 弹出窗口。

这是文档的链接:https ://selenium-python.readthedocs.org/en/latest/getting-started.html

和一些视频教程:

http://pyvideo.org/search?models=videos.video&q=selenium

于 2013-08-31T17:47:05.863 回答