javascript - 使用 Python 进行网页抓取，但值为空

翻译自：https://stackoverflow.com/questions/17032223 2013-06-10T20:26:49.380

219 次

0

我想从这个站点获取值：http ://cdn.ime-co.ir/和BeautifulSoup，但是当我尝试导入表时值是空的。我认为用 javascrip 或任何我不知道的东西禁用。请帮我将值导出为 csv 或 txt 格式。

import urllib2
from bs4 import BeautifulSoup
soup = BeautifulSoup(urllib2.urlopen('http://cdn.ime-co.ir/').read())
print soup

1 回答 1

0

BeautifulSoup 不支持 Javascript。如果您只需要解析一次，您显然可以将源代码保存到文件中并从那里解析。如果您需要多次获取该站点，您可以考虑使用 Webkit（这里是一个使用 PyQT4 和 Webkit 的示例）或PhantomJS来生成可以在 Python 中解析的源代码。

于 2013-06-10T20:37:13.173 回答