问题标签 [python-requests-html]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
0 回答
37 浏览

python - 请求表单提交,没有图像名称

我正在尝试通过请求提交表单,但似乎找不到发布图像的方法。

以下是浏览器请求:

这就是我的请求的样子:

但我似乎无法理解将图像内容添加到字典中的哪个键的位置。

编辑:我当前的代码:

并且图像上传器返回错误,但是当我通过浏览器执行此操作时,效果很好。

0 投票
2 回答
5554 浏览

python - 使用请求 HTML 找不到 css 类

在按照本教程查找 css 类并在网站上复制文本之后,我尝试将其实现为一个小文本代码,但遗憾的是它没有用。我在同一个网站上完全按照教程进行操作,确实获得了网页的标题,但无法让这个过程适用于该网页上的任何其他课程或任何其他网页。我错过了什么吗?我是一名初学者程序员,以前从未使用过 Request HTML 或类似的东西。这是我正在使用的代码示例,目的是在加载网页时抓取出现在“af-description”类中的随机事实。

无论我多么努力,无论我如何重新排列事物或尝试不同的代码,我都无法让它工作。似乎无法找到该类或该类包含的文本。请帮忙。

0 投票
2 回答
927 浏览

python - Python:如果脚本在 requests.get() 执行时停止会发生什么?

我知道它requests.get()提供了一个 HTTP 接口,以便程序员可以向 HTTP 服务器发出各种请求。

这告诉我必须在某个地方打开一个端口才能发生请求。

考虑到这一点,如果脚本在请求被回答/完成之前停止(例如,通过键盘中断,因此正在执行脚本的机器仍然连接到互联网)会发生什么?

端口/连接会保持打开状态吗?

端口/连接会自动关闭吗?

0 投票
0 回答
243 浏览

python - Python 视频未播放使用请求模块下载

我正在开发一个 Python(3.6) 和 Django(2) 项目,我需要从 URL 下载视频。这是我尝试过的:

来自views.py:

下载视频的 URL 是:

https://expirebox.com/files/386713962c5f8b7556bc77c4a6c2a576.mp4

它会下载一个名为 as 的文件,my_video.mp4但是当我尝试打开此视频时,它没有播放。

我的代码有什么问题?或者有没有更好的方法从 URL 下载视频。

0 投票
1 回答
389 浏览

python - 使用 requests_html 时无法按预期提取结果

我无法使用 requests_html 提取正确的结果:

我可以id在源内容中找到“productDetails_detailBullets_sections1”:

实际上,这个问题同样存在于 PyQuery 中。

为什么requests_html找不到这个元素?

0 投票
3 回答
225 浏览

python - 无法使用 HTML Scraping 导入数据

所以我正在制作一个 python 项目,我决定在其中做一个超市比较的东西。我决定从现有的超市比较网站中获取价格。

我用这个网站学习: https ://docs.python-guide.org/scenarios/scrape/

首先,我试图从这个网站获取苹果的价格(在 Tesco):

http://www.mysupermarket.co.uk/tesco-price-comparison/Fruit/Tesco_Gala_Apple_Approx_160g.html

使用文档代码的编辑版本,即:

我已经尝试了价格的 xpath 代码,但是当我打印价格时,它什么也不返回(一个空列表)

那么我将如何解决这个问题?

注意 - 我是 HTML Scraping 的新手,并且对 python 有基本的了解,但我决定有点挑战。

提前致谢。

0 投票
1 回答
2064 浏览

python - 如何使用新的 Requests-HTML 库查找特定类型的所有元素

我想在 HTML 中找到所有特定字段,在 Beautiful soup 中,一切都在使用以下代码:

但是如何使用 requests 库进行相同的搜索,或者 requests 只能在 HTML 文档中找到一个元素,我在文档或示例中找不到如何做到这一点?

https://html.python-requests.org/

例子:

如何使用请求库找到特定类型的所有元素?

0 投票
1 回答
9928 浏览

javascript - Python Requests-HTML Render() - 无内容

我想抓取一个页面,其内容似乎是由 html 中引用的应用程序呈现的,例如:

我正在使用 Requests-HTML python 库中的 render() 方法,如下所示:

此代码返回页面的 HTML,没有任何错误,但也没有任何内容(只是 HTML 标记)。笔记:

  • 我尝试向 session.get 添加超时参数,以便在访问页面之前有更多时间呈现页面以及上述语法的其他变体。

  • 还尝试根据此答案在标头中添加用户代理信息(以规避拒绝我的自动抓取)

  • 当我第一次运行 render() 时,铬浏览器确实下载了

没有任何错误消息让我很困惑,并且很难复制此请求的上下文以在另一个站点上进行测试。

任何有关如何解决的具体建议,或有关如何进行故障排除的想法,都值得赞赏。(Python 3.6,Mac 操作系统)

0 投票
1 回答
411 浏览

python - Python requests-html 抛出多处理错误

我正在尝试将我的网络抓取程序从使用 requests 库转移到 requests-html 库,以允许我在网页上呈现 javascript。在导入模块时会引发此错误:

任何帮助表示赞赏!

0 投票
0 回答
905 浏览

python - Python html-requests render() 不呈现 javascript 元素

我正在尝试抓取一个需要登录的网站,核心数据是用 javascript 和 XHR 文件呈现的。我正在使用该html-requests库,但该render()功能似乎对网页没有影响。这是我的代码:

这是返回的 html(重要位):

我没有设法破译所有脚本,因为我没有使用 javascript 的经验,尽管它们似乎正在获取数据。任何关于为什么这些脚本没有运行或任何替代解决方案(足够快)的解释都值得赞赏。