我是 Python 编程的初学者,我正在尝试学习如何抓取网页。我想做的是从这个网页上抓取数据
我正在尝试从上面的页面中抓取(如果你打开网页ISSUE DATE
,你可以看到)。ISSUE DATE
我面临一些问题。
这是我为此编写的代码。
import BeautifulSoup
import urllib2
url = "http://patft.uspto.gov/netacgi/nph-Parser?Sect1=PTO1&Sect2=HITOFF&d=PALL&p=1&u=%2Fnetahtml%2FPTO%2Fsrchnum.htm&r=1&f=G&l=50&s1=0000149.PN.&OS=PN/0000149&RS=PN/0000149"
data = urllib2.urlopen(url).read()
soup = BeautifulSoup.BeautifulSoup(data)
value1 = soup.findAll('TABLE')
for value in value1:
date1 = value.find('B').text
print date1