问题标签 [bs4]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
python - 无法搜索到搜索后找到的标签
我对 BeautifulSoup 有另一个问题。这是我的代码:
但是当我运行它时,我有一个错误告诉我:
我的 BeautifulSoup 版本是 ,4.4.0
但它可以在拥有4.3.2
.
这些版本之间有什么区别?如何使代码在我的计算机上运行?
谢谢你的帮助!
python - TypeError:“str”对象不可调用
我在我的程序中添加了几行代码,以使用 BeautifulSoup 将 html 转换为 json,但是这些添加的代码行出现错误。
我收到一个错误
关于运行代码。谁能告诉我解决此错误的正确方法。
python - 使用 bs4 仅从维基词典中提取部分元素
我设法只打印了 h2 和 h3 标签。但我想要从第一个 h2 到第二个 h2 标签的每个元素(这些标签中的数据仅与英语有关)。就像在这张图片中然后,我想检查名词,动词等类别的数据,如果它们存在 - 将它们打印出来。在这里被卡住了。这是我到目前为止写的
python - 抓取和解析后存储数据
我有一个使用 Beautiful Soup 4 解析的 html 文件,这是我感兴趣的部分
我只需要分别提取 Name 和 Mobile (它们在解析树中处于同一级别)。我该怎么做?我已经尝试过使用soup.find_next_siblings 方法,但无法以所需的格式存储数据( Number 和 Mobile 的两个单独列表)
python - 如何使用 Beautiful Soup 查找所有评论
这个问题是四年前提出的,但现在对于 BS4 来说答案已经过时了。
我想使用漂亮的汤删除我的 html 文件中的所有评论。由于 BS4 将每个评论作为一种特殊类型的可导航字符串,我认为这段代码可以工作:
所以这不起作用....如何使用 BS4 找到所有评论?
python - bs4 Python 3.4中的UnicodeDecodeError
我有一部分代码
执行后我得到一个错误:
我也尝试过'rb'和'r'模式,但这不起作用......
在文件中,我有带有俄语单词的文章。
几天前,它工作得很好
python - 如何使用 BeautifulSoup4 删除 XML 声明
我有一个结构如下的 XHTML 文件:
我正在使用 BeautifulSoup,我想从文档中删除 XML 声明,所以我所拥有的看起来像这样:
我找不到获取 XML 声明以将其删除的方法。据我所知,它似乎不是 Doctype、Declaration、Tag 或 NavigableString。有没有办法找到它来提取它?
作为一个工作示例,我可以使用这样的代码删除 Doctype(假设文档文本是变量“html”):
python - 在“find_all”中添加超过 1 个条件以搜索 HTML 代码
我正在尝试让 BeautifulSoup 搜索以下标签:
我应该如何在第一行代码中表达我的要求?我在下面输入的代码是否合适?
python - 使用 Python 请求抓取页面
我在网络抓取方面遇到了一些问题,这是我的代码:
在此请求之后,我得到的结果与我提出的不同:
进入我的网络浏览器,是什么导致了这个问题?是否有与页面重定向或其他相关的东西?
python - 如何获得在特定之后出现的?
这是网页的布局:
<h2>Featured Ads</h2>
<a href=""></a>
<h2>Ads</h2>
<a href=""></a>
常规广告中没有任何东西class
可以用来区分它们。什么是只返回
这是网页的布局:
常规广告中没有任何东西class
可以用来区分它们。什么是只返回<a href>
之后出现的 's的有效方法<h2>Ads</h2>
?
更新:
这是最终代码
更新 2:必须重构...
wordpress中页面的自定义模板
是否可以为这不是首页的页面创建自定义 php 模板
例如:当您的主页有front-page.php 时,我想做一些类似的事情。
我不知道这是否可能,但如果是的话,谢谢您的回答
这是网页的布局:
<h2>Featured Ads</h2>
<a href=""></a>
<h2>Ads</h2>
<a href=""></a>
常规广告中没有任何东西class
可以用来区分它们。什么是只返回
这是网页的布局:
常规广告中没有任何东西class
可以用来区分它们。什么是只返回<a href>
之后出现的 's的有效方法<h2>Ads</h2>
?
更新:
这是最终代码
更新 2:必须重构...
wordpress中页面的自定义模板
是否可以为这不是首页的页面创建自定义 php 模板
例如:当您的主页有front-page.php 时,我想做一些类似的事情。
我不知道这是否可能,但如果是的话,谢谢您的回答