问题标签 [bs4]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
python - 由于 bs4 与 BeautifulSoup 导致的导入错误
我正在尝试使用beautifulsoup
compatible lxml
,它给了我一个错误:
我已经bs4
安装了。我该如何解决这个问题?
python - Python/BeautifulSoup - 如何在和标签
- 标签
我有以下 html 代码
如何提取<li>
和<dl>
标签之间的文本。
我试过这个:
这将打印
我只想要第一行。
python - Python 和 BS4 - 在一定次数后停止阅读
第一次使用 Python 3 并开始掌握它。作为一个练习,我试图从http://rateyourmusic.com/customchart读取表格(使用 BeautifulSoup4) ,并将排名、艺术家、专辑和年份转换为字典。然后我想将字典放入 MySQL 数据库。我能够从表中获取所有信息并将它们放入变量中,然后放入字典中,但我有一个小问题。表中的最后一个条目是一个广告,因此它不会跟在它上面的其他表行之后。我只想读取表格的前 100 行。尝试读取广告行时出现错误。
这是我的代码。请任何帮助都会很棒。此外,如果您在我的代码中看到任何错误,或者我可以如何做得更好,请告诉我。
所以它正在打印字典,一切看起来都很好,但是在打印完所有字典后它给了我一个错误。
python - BeautifulSoup: how to get children of div tab
Here is my code.
I want to scrape data from this website but that div doesn't have class that is why I don't know how to do that then I found that you can find children of div tag but it is also not working and I'm trying to get all tag.
python - Beautifulsoup 和 bs4 有什么区别
我是 python 新手,我尝试解析一些 XML 文件以添加一些新标签并存储新的 XML 文件。
python-beautifulsoup
接缝是正确的包装。在网上搜索教程,如何向 BeautifulSoup 解析的 XML 添加新标签,我发现python-bs4
使用了该包。
查看包描述,两个包的标题相同:
所以我的问题是:有什么区别?
python - 在 BeautifulSoup 4 中解析一个类
基本上我想访问 html 表中的元素。
这是我的代码:
我一无所有...[]
我在同一个 td 上尝试了这种方法,但这次是在本地文本文件上,这似乎工作正常。我究竟做错了什么?
python - 如何使用 BeautifulSoup4 优雅地获取 html td 的顶级文本?
下面是一个用 beautifulsoup4 解析的简单 html 段,我希望提取顶级原始文本hello。
而且我尝试了几种直观的方法,但没有预期的结果:
那么如何实现这个目标呢?
python - 如何抓取一个网站块
html的部分看起来像这样,
如何将其作为格式获取,例如:
到目前为止,我只知道使用 bs4 来获取所有文本:
python - 使用 Python 和 BeautifulSoup 访问网页中标签的标题属性
我是 Python 新手,我正在尝试从特定 url 检索所有标题,但我无法这样做。代码正在编译,没有任何错误,但我仍然没有得到输出。
python - Beautifulsoup 获取标签内容的最简单方法
问题是contents
Beautifulsoup 标签的 The 是一个列表而不是一个字符串。因此,我必须使用 for 循环来获取标签内的内容。这很麻烦。有更好的方法吗?
输出:
字符串1. <span class="cat">cat</span>example<span class="ex">ex</span>
是我想要的,但我需要一个更简单的方法来获取它。