1

我想在 Python 中读取用户输入以获取 url(例如http://www.google.com),然后以 HTML 格式(仅文本)将网页打印到终端。我尝试使用pexpect.spawn('elinks')但 elinks 似乎没有写入标准输出。我还查看了 HTMLParser 模块,但我不知道如何将生成的文本格式化为类似于网页的内容。有什么建议吗?

4

3 回答 3

2

这是一个不小的挑战。你想要生成的事实elinks让我想知道你为什么不直接使用它。查看它有哪些可扩展性/插件/插件选项,或尝试重写它以满足您的特定需求。

最终,您需要使用 curses 后端编写自己的浏览器布局引擎。如果您使用的是 python,urwid则它是 curses 布局的流行选择。

于 2011-12-04T17:58:11.757 回答
0

使用 python urllib

输入 url --> urllib --> 页面 --> 在控制台打印

# example in the python urllib page

import urllib

opener = urllib.FancyURLopener({})
f = opener.open("http://www.python.org/")
f.read()

# modify:

html = f.read()

# add:

print html

# to print in terminal

它类似于 unix 中的“curl”

于 2011-12-04T22:40:19.983 回答
-3
import requests
r = requests.get('http://www.google.com/')
print(r.content)
于 2014-09-27T04:39:42.877 回答