我想从给定的 URL 中获取纯文本(例如,没有 html 标签和实体)。我应该使用什么库来尽快做到这一点?
我已经尝试过(也许有比这更快或更好的东西):
import re
import mechanize
br = mechanize.Browser()
br.open("myurl.com")
vh = br.viewing_html
//<bound method Browser.viewing_html of <mechanize._mechanize.Browser instance at 0x01E015A8>>
谢谢