问题标签 [pyquery]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
0 回答
15 浏览

pyquery - 我似乎无法弄清楚这段代码有什么问题

0 投票
1 回答
116 浏览

python - 在多处理中使用管理器的全局变量错误

这是我的代码,关键是tweets在多处理中共享变量:

但是,错误在代码中显示tweets = manager(tweets)Pickle.PicklingError:Can't pickle<class 'pyquery.pyquery.NoDefault'>:attribute lookup pyqery.pyquery.NoDefault failed.

我猜这是因为 pyquery 类型,但仍然不知道如何修复它?

任何想法都会有所帮助。

0 投票
1 回答
416 浏览

python - pyquery response.body 检索 div 元素

我正在尝试使用scrapy和PyQuery编写一个网络爬虫。完整的蜘蛛代码如下。

网页骨架

爬虫的输出,爬虫获取请求 URL 并命中正确的 Web 目标,但 parse_item 或 parse 方法没有得到响应。Response.URL 未打印。我试图通过运行没有日志的蜘蛛来验证这一点 scrapy crawl rsscach--nolog 但没有任何内容打印为日志。这个问题非常细化。

如何获取属性的客户端、位置和大小?

0 投票
1 回答
462 浏览

python - Pyquery获取元素计数

在 python 库pyquery中,查询结果是一个<class 'pyquery.pyquery.PyQuery'>对象,而不是字典或数组。那么如何获取本例中的查询结果计数result

0 投票
1 回答
238 浏览

python - Pyquery获取“srcset”属性的值

我正在尝试使用 pyquery & python3 提取标签srcset的属性。img

提取alt属性按预期工作,并返回“my-image”

但是这种方法不适用于属性srcset。它返回None

如何解决这个问题?如果没有内置方式,可能是正则表达式?谢谢。

0 投票
1 回答
174 浏览

cookies - 将 Firefox 会话中的现有 cookie 用于 PyQuery 请求

我想PyQuery用于从需要身份验证的站点中提取信息。

我可以“手动”访问该站点,然后在 Firefox 中查看生成的 cookie

工具 > Web 开发人员 > 存储检查器。

我可以以某种方式将此 cookie 与 结合使用PyQuery吗?

这应该(希望)使我免于对身份验证过程进行逆向工程(显然重定向到Shibbolet)。我正在想象从 Firefox 中导出 cookie,然后在初始化时使用它的组合PyQuery

0 投票
1 回答
448 浏览

jquery - 使用python中的pyquery删除html中的所有隐藏元素

我有一段 html 代码,我必须从中删除隐藏的元素。我尝试了以下代码

这不是删除隐藏的元素。知道如何删除那些隐藏的元素

0 投票
1 回答
330 浏览

python - 使用 Pyquery、Requests 和 Gadget 选择器提取 Web 元素

我可以使用以下代码从该网站提取表值。

但我只能提取前 20 个值。页面末尾有一个“下一步”按钮,其中包含指向下一组值的链接。

如何自动提取此链接、获取新页面并提取新值集并附加到我现有的列表中?

0 投票
1 回答
498 浏览

python - 如何使用python从无限滚动网页中提取值?

我无法从该网站提取任何数据。此代码适用于其他网站。此外,如果注册用户向下滚动,该网站是可扩展的。如何从此类网站的表中提取数据?

0 投票
1 回答
50 浏览

python - “for a in html('.l')”在python中的含义

我一直在看howdoi的源代码。 https://github.com/gleitz/howdoi

在这里 extract_links_from_bing 和 extract_links_from_google 有这种语法。

我试图在线搜索与 xml、元素树相关的所有内容,但在任何地方都找不到类似语法的构造函数。

这是功能

我的问题是如何html('.b_algo')('h2')('a')迭代。任何与类似语法相关的链接将不胜感激。

谢谢阅读。