我想在 Python 中读取用户输入以获取 url(例如http://www.google.com),然后以 HTML 格式(仅文本)将网页打印到终端。我尝试使用pexpect.spawn('elinks')
但 elinks 似乎没有写入标准输出。我还查看了 HTMLParser 模块,但我不知道如何将生成的文本格式化为类似于网页的内容。有什么建议吗?
问问题
12599 次
3 回答
2
这是一个不小的挑战。你想要生成的事实elinks
让我想知道你为什么不直接使用它。查看它有哪些可扩展性/插件/插件选项,或尝试重写它以满足您的特定需求。
最终,您需要使用 curses 后端编写自己的浏览器布局引擎。如果您使用的是 python,urwid
则它是 curses 布局的流行选择。
于 2011-12-04T17:58:11.757 回答
0
使用 python urllib
输入 url --> urllib --> 页面 --> 在控制台打印
# example in the python urllib page
import urllib
opener = urllib.FancyURLopener({})
f = opener.open("http://www.python.org/")
f.read()
# modify:
html = f.read()
# add:
print html
# to print in terminal
它类似于 unix 中的“curl”
于 2011-12-04T22:40:19.983 回答
-3
import requests
r = requests.get('http://www.google.com/')
print(r.content)
于 2014-09-27T04:39:42.877 回答