0

我有这个代码:

url = "http://www.padtube.com/Audio-Music-Editor/10-75359.html"
pageurl = urllib.urlopen(url)
soup = BeautifulSoup(pageurl)

for table in soup.select("table#product-quickfacts-table"):
    print table.find('meta',{'itemprop':'datePublished'})

当我运行这段代码时,它给了我这个输出:

<meta content="2012-03-01T00:00:00-05:00" itemprop="datePublished"/>

我怎样才能只取日期?

4

1 回答 1

1

你的线

print table.find('meta',{'itemprop':'datePublished'})

<meta content="2012-03-01T00:00:00-05:00" itemprop="datePublished"/>

返回包含属性的元素元itemprop='datePublished'。您只想访问content此 xml 元素的节点

print table.find('meta',{'itemprop':'datePublished'})['content']

2012-03-01T00:00:00-05:00
于 2013-11-08T07:09:32.837 回答