问题标签 [python-requests-html]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
python - 请求表单提交,没有图像名称
我正在尝试通过请求提交表单,但似乎找不到发布图像的方法。
以下是浏览器请求:
这就是我的请求的样子:
但我似乎无法理解将图像内容添加到字典中的哪个键的位置。
编辑:我当前的代码:
并且图像上传器返回错误,但是当我通过浏览器执行此操作时,效果很好。
python - 使用请求 HTML 找不到 css 类
在按照本教程查找 css 类并在网站上复制文本之后,我尝试将其实现为一个小文本代码,但遗憾的是它没有用。我在同一个网站上完全按照教程进行操作,确实获得了网页的标题,但无法让这个过程适用于该网页上的任何其他课程或任何其他网页。我错过了什么吗?我是一名初学者程序员,以前从未使用过 Request HTML 或类似的东西。这是我正在使用的代码示例,目的是在加载网页时抓取出现在“af-description”类中的随机事实。
无论我多么努力,无论我如何重新排列事物或尝试不同的代码,我都无法让它工作。似乎无法找到该类或该类包含的文本。请帮忙。
python - Python:如果脚本在 requests.get() 执行时停止会发生什么?
我知道它requests.get()
提供了一个 HTTP 接口,以便程序员可以向 HTTP 服务器发出各种请求。
这告诉我必须在某个地方打开一个端口才能发生请求。
考虑到这一点,如果脚本在请求被回答/完成之前停止(例如,通过键盘中断,因此正在执行脚本的机器仍然连接到互联网)会发生什么?
端口/连接会保持打开状态吗?
端口/连接会自动关闭吗?
python - Python 视频未播放使用请求模块下载
我正在开发一个 Python(3.6) 和 Django(2) 项目,我需要从 URL 下载视频。这是我尝试过的:
来自views.py:
下载视频的 URL 是:
https://expirebox.com/files/386713962c5f8b7556bc77c4a6c2a576.mp4
它会下载一个名为 as 的文件,my_video.mp4
但是当我尝试打开此视频时,它没有播放。
我的代码有什么问题?或者有没有更好的方法从 URL 下载视频。
python - 使用 requests_html 时无法按预期提取结果
我无法使用 requests_html 提取正确的结果:
我可以id
在源内容中找到“productDetails_detailBullets_sections1”:
实际上,这个问题同样存在于 PyQuery 中。
为什么requests_html
找不到这个元素?
python - 无法使用 HTML Scraping 导入数据
所以我正在制作一个 python 项目,我决定在其中做一个超市比较的东西。我决定从现有的超市比较网站中获取价格。
我用这个网站学习: https ://docs.python-guide.org/scenarios/scrape/
首先,我试图从这个网站获取苹果的价格(在 Tesco):
http://www.mysupermarket.co.uk/tesco-price-comparison/Fruit/Tesco_Gala_Apple_Approx_160g.html
使用文档代码的编辑版本,即:
我已经尝试了价格的 xpath 代码,但是当我打印价格时,它什么也不返回(一个空列表)
那么我将如何解决这个问题?
注意 - 我是 HTML Scraping 的新手,并且对 python 有基本的了解,但我决定有点挑战。
提前致谢。
python - 如何使用新的 Requests-HTML 库查找特定类型的所有元素
我想在 HTML 中找到所有特定字段,在 Beautiful soup 中,一切都在使用以下代码:
但是如何使用 requests 库进行相同的搜索,或者 requests 只能在 HTML 文档中找到一个元素,我在文档或示例中找不到如何做到这一点?
https://html.python-requests.org/
例子:
如何使用请求库找到特定类型的所有元素?
javascript - Python Requests-HTML Render() - 无内容
我想抓取一个页面,其内容似乎是由 html 中引用的应用程序呈现的,例如:
我正在使用 Requests-HTML python 库中的 render() 方法,如下所示:
此代码返回页面的 HTML,没有任何错误,但也没有任何内容(只是 HTML 标记)。笔记:
我尝试向 session.get 添加超时参数,以便在访问页面之前有更多时间呈现页面以及上述语法的其他变体。
还尝试根据此答案在标头中添加用户代理信息(以规避拒绝我的自动抓取)
当我第一次运行 render() 时,铬浏览器确实下载了
没有任何错误消息让我很困惑,并且很难复制此请求的上下文以在另一个站点上进行测试。
任何有关如何解决的具体建议,或有关如何进行故障排除的想法,都值得赞赏。(Python 3.6,Mac 操作系统)
python - Python requests-html 抛出多处理错误
我正在尝试将我的网络抓取程序从使用 requests 库转移到 requests-html 库,以允许我在网页上呈现 javascript。在导入模块时会引发此错误:
任何帮助表示赞赏!
python - Python html-requests render() 不呈现 javascript 元素
我正在尝试抓取一个需要登录的网站,核心数据是用 javascript 和 XHR 文件呈现的。我正在使用该html-requests
库,但该render()
功能似乎对网页没有影响。这是我的代码:
这是返回的 html(重要位):
我没有设法破译所有脚本,因为我没有使用 javascript 的经验,尽管它们似乎正在获取数据。任何关于为什么这些脚本没有运行或任何替代解决方案(足够快)的解释都值得赞赏。