问题标签 [bs4]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
3 回答
4812 浏览

python - 由于 bs4 与 BeautifulSoup 导致的导入错误

我正在尝试使用beautifulsoupcompatible lxml,它给了我一个错误:

我已经bs4安装了。我该如何解决这个问题?

0 投票
1 回答
2324 浏览

python - Python/BeautifulSoup - 如何在
  • 标签
  • 我有以下 html 代码

    如何提取<li><dl>标签之间的文本。

    我试过这个:

    这将打印

    我只想要第一行。

    0 投票
    2 回答
    174 浏览

    python - Python 和 BS4 - 在一定次数后停止阅读

    第一次使用 Python 3 并开始掌握它。作为一个练习,我试图从http://rateyourmusic.com/customchart读取表格(使用 BeautifulSoup4) ,并将排名、艺术家、专辑和年份转换为字典。然后我想将字典放入 MySQL 数据库。我能够从表中获取所有信息并将它们放入变量中,然后放入字典中,但我有一个小问题。表中的最后一个条目是一个广告,因此它不会跟在它上面的其他表行之后。我只想读取表格的前 100 行。尝试读取广告行时出现错误。

    这是我的代码。请任何帮助都会很棒。此外,如果您在我的代码中看到任何错误,或者我可以如何做得更好,请告诉我。

    所以它正在打印字典,一切看起来都很好,但是在打印完所有字典后它给了我一个错误。

    0 投票
    3 回答
    2271 浏览

    python - BeautifulSoup: how to get children of div tab

    Here is my code.

    I want to scrape data from this website but that div doesn't have class that is why I don't know how to do that then I found that you can find children of div tag but it is also not working and I'm trying to get all tag.

    0 投票
    3 回答
    15759 浏览

    python - Beautifulsoup 和 bs4 有什么区别

    我是 python 新手,我尝试解析一些 XML 文件以添加一些新标签并存储新的 XML 文件。

    python-beautifulsoup接缝是正确的包装。在网上搜索教程,如何向 BeautifulSoup 解析的 XML 添加新标签,我发现python-bs4使用了该包。

    查看包描述,两个包的标题相同:

    所以我的问题是:有什么区别?

    0 投票
    1 回答
    96 浏览

    python - 在 BeautifulSoup 4 中解析一个类

    基本上我想访问 html 表中的元素。

    这是我的代码:

    我一无所有...[]

    我在同一个 td 上尝试了这种方法,但这次是在本地文本文件上,这似乎工作正常。我究竟做错了什么?

    0 投票
    1 回答
    644 浏览

    python - 如何使用 BeautifulSoup4 优雅地获取 html td 的顶级文本?

    下面是一个用 beautifulsoup4 解析的简单 html 段,我希望提取顶级原始文本hello

    而且我尝试了几种直观的方法,但没有预期的结果:

    那么如何实现这个目标呢?

    0 投票
    1 回答
    59 浏览

    python - 如何抓取一个网站块

    html的部分看起来像这样,

    如何将其作为格式获取,例如:

    到目前为止,我只知道使用 bs4 来获取所有文本:

    0 投票
    2 回答
    2879 浏览

    python - 使用 Python 和 BeautifulSoup 访问网页中标签的标题属性

    我是 Python 新手,我正在尝试从特定 url 检索所有标题,但我无法这样做。代码正在编译,没有任何错误,但我仍然没有得到输出。

    0 投票
    1 回答
    333 浏览

    python - Beautifulsoup 获取标签内容的最简单方法

    问题是contentsBeautifulsoup 标签的 The 是一个列表而不是一个字符串。因此,我必须使用 for 循环来获取标签内的内容。这很麻烦。有更好的方法吗?

    输出:

    字符串1. <span class="cat">cat</span>example<span class="ex">ex</span>是我想要的,但我需要一个更简单的方法来获取它。