0

我敢肯定,这很容易。我正在解析一个网站,并试图获取标签之间的特定文本。文本将 == [revoked, Active, Default] 我正在使用 Python。我已经能够打印出所有内部文本结果,但我无法在网络上为特定文本找到一个好的解决方案。这是我的代码

from BeautifulSoup import BeautifulSoup
import urllib2
import re

url = urllib2.urlopen("Some URL")
content = url.read()
soup = BeautifulSoup(content)
for tag in soup.findAll(re.compile("^a")):

print(tag.text)
4

2 回答 2

1

我仍然不确定我是否理解您要做什么,但我会尽力提供帮助。

soup.find_all('a', text=['revoked', 'active', 'default'])

这将仅选择那些<a …&gt;具有给定字符串之一作为其文本的标签。

于 2013-05-27T21:34:30.023 回答
0

我在类似的场合使用过下面的代码片段。看看这是否符合您的目标:

table = soup.find(id="Table3")

for i in table.stripped_strings:
    print(i)
于 2013-05-27T21:19:52.293 回答