问题标签 [pyquery]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
3 回答
627 浏览

python - 为什么这个未绑定的变量可以在 Python (pyquery) 中工作?

代码来自pyquery的指南

我的问题是this在第 3 行是一个未绑定的变量,并且从未在当前环境中定义,但上面的代码仍然有效。

它如何工作?为什么它不抱怨NameError: name 'this' is not defined

似乎在https://bitbucket.org/olauzanne/pyquery/src/c148e4445f49/pyquery/pyquery.py#cl-478发生了一些事情,有人可以解释一下吗?

0 投票
2 回答
4119 浏览

python - Python/PyQuery:找不到 vcvarsall.bat?

我有 Python 2.7,我正在尝试使用 PyQuery,所以对于测试,我只输入了“import PyQuery”,但出现错误:

所以我去命令提示符并尝试安装lxml,但我得到了这个:

我真的不明白出了什么问题或我应该做什么......有人可以帮忙吗?

谢谢。

编辑:

为了回应评论,我使用了简单的安装...

0 投票
6 回答
299607 浏览

python - 如何使用 Python 的 Requests 模块“登录”到网站?

我正在尝试使用 Python 中的 Requests 模块发布登录网站的请求,但它并没有真正起作用。我是新手......所以我不知道是否应该制作我的用户名和密码 cookie 或我发现的某种类型的 HTTP 授权 (??)。

所以现在,我想我应该使用“post”和cookie....

我有一种感觉,我做错了饼干……我不知道。

如果没有正确登录,主页的标题应该是“Locationary.com”,如果是,它应该是“主页”。

如果您能向我解释一些关于请求和 cookie 的事情并帮助我解决这个问题,我将不胜感激。:D

谢谢。

...它仍然没有真正起作用。好的...所以这是主页 HTML 在您登录之前所说的内容:

所以我认为我做得对,但输出仍然是“Locationary.com”

第二次编辑:

我希望能够长时间保持登录状态,并且每当我请求该域下的页面时,我希望内容显示为好像我已登录一样。

0 投票
2 回答
2667 浏览

javascript - Python - 处理 javascript URL?

我正在尝试下载通过 javascript 请求的页面的 html,通常通过单击浏览器中的链接。我可以下载第一页,因为它有一个通用 URL:

但是页面底部的链接是数字(1 到 10)。因此,如果您单击一个,它将转到例如第 2 页:

当我将该 URL 放入我的程序并尝试下载 html 时,它给了我网站上不同页面的 html,我认为它是主页。

当没有特定的 URL 时,如何获取这个使用 javascript 的 URL 的 html?

谢谢。

PS 我正在使用 urllib/urllib2 和 cookielib。

另外,我刚刚发现了一个叫做 PyQuery 的东西?我可以用那个吗?我该怎么做?

代码:

0 投票
1 回答
1455 浏览

python - 如何在将pyquery对象转换为字符串时取消转义特殊字符

我正在尝试使用 python requests 模块获取远程页面,重建 DOM 树,进行一些处理并将结果保存到文件中。当我获取一个页面然后将其写入文件时,一切正常(我稍后可以在浏览器中打开一个 html 文件并且它被正确呈现)。

但是,如果我创建一个 pyquery 对象并进行一些处理,然后使用 str 转换将其保存,则会失败。具体来说,像 && 等特殊字符会在已保存源的脚本标签中被修改(由 pyquery 应用引起),它会阻止页面正确呈现。

这是我的代码:

所以,问题是:如何确保在应用 pyquery 后特殊字符不会被转义?我想它可能与 lxml(pyquery 的父库)有关,但是在网上进行了繁琐的搜索并尝试了不同的对象序列化方式后,我仍然没有成功。也许这也与Unicode处理有关?!

提前谢谢了!

0 投票
2 回答
14778 浏览

python - 在 PyQuery 中获取属性?

我正在使用 PyQuery 并想打印链接列表,但无法弄清楚如何href从 PyQuery 语法中的每个链接获取属性。

这是我的代码:

这将打印10,然后给出以下错误:

我究竟做错了什么?

0 投票
1 回答
3035 浏览

python - PyQuery:只获取元素的文本,而不是子元素的文本

我有以下 HTML:

我想拿出 295 美元。但是,如果我只是按如下方式使用 PyQuery:

我得到了这两个价格。

在 jQuery 中仅提取元素的直接子文本看起来相当复杂 - 在 PyQuery 中有没有办法做到这一点?

目前我正在单独提取第一个价格,然后使用替换将其从文本中删除,这有点繁琐。

谢谢你的帮助。

0 投票
1 回答
2163 浏览

python - 如何使用 PyQuery 获取表内多个标签的文本内容?

如何从给定的书籍详细信息表字段中选择属性的文本字段,其中值在文本或文本字段中?

0 投票
1 回答
53815 浏览

python - 将 UTF-8 字符串作为内容的 unicode 转换为 str

我正在使用 pyquery 来解析页面:

但我得到的content是一个带有 utf-8 编码内容的 unicode 字符串:

我怎样才能在str不丢失内容的情况下将其转换为?

说清楚:

我想conent == '\xe5\xb1\x82\xe5\x8f\xa0\xe6\xa0\xb7\xe5\xbc\x8f\xe8\xa1\xa8'

不是conent == u'\xe5\xb1\x82\xe5\x8f\xa0\xe6\xa0\xb7\xe5\xbc\x8f\xe8\xa1\xa8'

0 投票
1 回答
1421 浏览

python - AttributeError:“XPathExpr”对象没有属性“add_post_condition”

我正在尝试在 Windows 上安装pyquery,当我尝试执行这样的选择时出现以下错误d('p:first')。其他一切似乎都在工作。知道我错过了什么吗?这个问题只发生在我的 Windows 机器上,在我的 MAC 上工作正常。