2

我对网络抓取完全陌生,并且以前只使用 Python 使自己成为使用套接字等的 IRC。

我想用我的 IRC 做的是让客户从我使用 Google Blogger 制作的免费博客中获取 IP 或 IP 列表。

所以很自然,我需要做一些网络抓取来获取这些信息。问题是,我怎样才能做到这一点,而不需要客户端下载这个必须安装像 Beautiful Soup 这样的插件才能让它工作?

问题总结: 需要在不使用第三方模块的情况下从网页中抓取一些数据。

我做了一堆谷歌搜索,但只找到使用 Beautiful Soup 的解决方案。(即使这样,也很难理解)

4

1 回答 1

3
import urllib2,re
content = urllib2.urlopen("http://somme.url").read()
print re.findall("\d{1,3}\.\d{1,3}\.\d{1,3}\.\d{1,3}",content)

类似的东西

于 2013-09-08T16:32:00.473 回答