我是一个初学者程序员,所以这可能是一个微不足道的问题:我有一个带有深度嵌套无序列表的 .html 文件。例如,如何将前 4 个嵌套级别复制到 Python 中的新空 .html 文件中?我需要 BeautifulSoup 吗?为了更好的说明,这里是 Javascript 中显示效果的代码:
function nestless(root, selector, level) {
var use = root;
for (var i = 0; i <= level; i++) {
use += ' ' + selector;
}
$(use).remove();
}
在这里我会使用:
nestless('#root', 'ul', 4);
看来我原来的问题写得不好,难以解析,对此我深表歉意。.html 文件并不是真正的网站,而是在 html 编辑器中手动编写的文本文档并保存在 .html 中。它们包含无法用 LaTeX 编辑器编写的任何内容。
例如,如果我想将此列表减少到前 2 个级别:
- 一个
- 乙
- C
- D
- 乙
- F
- G
至
- 一个
- 乙
- C
- D
- G
根据我自己的研究,在 BeautifulSoup+soupselect、PyQuery 或 lxml 中有通过 CSS 选择器的 .html 解析器,但我不确定最简单的方法是什么或从哪里开始阅读。