2

我正在制作一个简单的命令行程序,用于使用 Python 中的 Twill 模块从网站(非常通用)收集和解析信息。我想使用 Twill 的 show() 命令将 HTML 输出分配给一个变量,以通过我的解析命令运行页面,但每次我将它分配给一个变量...

htmlString = twill.commands.show()

我在命令行(和 IDLE,就此而言)收到了大量的 HTML。为什么是这样?我不是要打印变量,它附近没有打印命令。我只想分配以进行进一步的操作。为什么变量赋值会导致打印发生?这不是一个致命的错误或任何东西,只是真的,真的很不方便。我在 Python 2.6、Twill 0.9 和 Ubuntu 上,如果这与任何事情有关的话。

4

2 回答 2

3

我建议使用lxmlBeautifulSoup解析 HTML,从未遇到过twill. 但是我看到你调用.show()方法,也许这个方法print里面有声明。

于 2011-04-29T12:09:53.267 回答
1

斜纹布是一种奇怪的东西,它会在终端上打印很多输出。导致打印出来的不是变量赋值,而是show()方法。它将打印(而不是返回)输出。

于 2011-09-26T09:31:19.680 回答