问题标签 [beautifulsoup]

问问题

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

28207 问题

0 投票

1 回答

6299 浏览

python - 使用 BeautifulSoup 选择特定的子元素

我正在阅读 BeautifulSoup 以对一些非常重的 html 页面进行屏幕抓取。通过 BeautifulSoup 的文档，我似乎找不到选择子元素的简单方法。

给定html：

鉴于我有对象顶部，我想要一种简单的方法来获得“我想要的内容”。来到 BeautifulSoup，我认为这很容易，类似于 topobj.nodes[1].nodes[0].string。相反，我只看到变量和函数也返回元素以及文本节点、注释等。

我错过了什么吗？或者我真的需要使用 .find() 或者更糟糕的是在 .contents 变量上使用 list comphrensions。

原因是我不相信网页的空白是相同的，所以我想忽略它，只遍历元素。

2009-10-15T11:12:42.223

0 投票

1 回答

600 浏览

python - Pamie 和 python-win32 问题 pamie3 不工作

目前我正在制作一些网页抓取脚本。我选择 PAMIE 来使用我的脚本。实际上我是 python 和编程的新手。所以我不知道，如果我使用 PAMIE，制作与 win32-python 相关的脚本真的很有帮助。好的，我的问题是，在我制作脚本时，我遇到了两个问题。首先，我想让我的脚本与 Beautifulsoup 和 PAMIE 一起工作。或者它也可以..如果可以一起使用本地 Internet Explorer 界面。

但这对我不起作用。我正在使用 PAMIE3 版本。即使我更改为 pamie 2b 版本，我也无法使其正常工作。

我的第二个问题是，在我制作脚本时，我想有时我需要正常的 IE 界面。是否可以将 PAMIE 的 IE 界面更改为普通的 IE 界面（InternetExplorer.Application）？我不想打开新的 IE 窗口来使用普通的 IE 界面，想继续使用当前 PAMIE 的 IE 窗口。对不起我糟糕的英语保罗

python winapi beautifulsoup pamie

2009-10-23T07:23:45.243

0 投票

1 回答

1918 浏览

python - BeautifulSoup 与 Jython

我刚刚尝试使用 Jython (2.5.1) 运行 BeautifulSoup (3.1.0.1)，我惊讶地发现它比 CPython 慢了多少。使用 CPython解析页面 ( http://www.fixprotocol.org/specifications/fields/5000-5999 ) 只需不到一秒（准确地说是 0.844 秒）。使用 Jython 需要 564 秒 - 几乎是 700 倍。

谁能证实这个结果？Jython 的运行速度比 CPython 慢 700 倍似乎是不合理的。也许我的设置有问题。

[编辑] 这是我用来测试的代码（当然我下载了上面提到的 HTML 文件）：

python jython beautifulsoup

2009-11-02T13:22:53.220

0 投票

2 回答

7241 浏览