问题标签 [pyquery]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
2 回答
182 浏览

python - PyQuery如何将一个元素附加和重命名到它的每个子元素中

如何将类属性附加或插入到其子元素中,但仅适用于直接子元素,然后为下一个类和子元素重复它。

在文档中,这里引用了pyquery manipulating

样本

所以对于每个种族

将其附加到其称为提名的子元素中,因此提名成为

然后重复这个<race id="211912"和提名是它的孩子。

0 投票
2 回答
2486 浏览

jquery - PDFQuery:获取元素所在的页码

这是我第一次使用PDFQuery来抓取 PDF。

我需要做的是从有几页的价目表中获取价格,我想将产品代码提供给 PDFQuery,它应该找到代码并在它旁边返回价格。问题是使用 Github 页面上的第一个示例获取文本的位置,但它清楚地表示“请注意,我们不必知道名称在页面上的位置,或者它在哪个页面上”。我的价目表就是这种情况,但是所有其他示例都指定了页码(LTPage[pageid=1]),但我看不到我们从哪里得到页码。

如果我不指定页码,它会为所有页面返回同一位置的所有文本。

另外,我添加了一个exactText函数,因为代码可能是,例如,“92005”、“92005C”、“92005G”,所以:contains单独使用并没有多大帮助。

我尝试选择元素所在的页面,并使用 JQuery .closest,但都没有运气。

我检查了PDFMiner 文档PyQuery 文档 ,但我没有看到任何对我有帮助的东西 =(

我的代码现在看起来像这样:

任何帮助都非常感谢,伙计们和女孩们!!!

0 投票
1 回答
381 浏览

phantomjs - 无法使用 pyspider 和 phantomjs 抓取图像

现在我想在这个网页上刮掉所有物品(iphone)的图像。首先我把图片的所有链接都解压出来,然后一个一个的发送请求到src,下载到文件夹'/phone/'。这是我的代码:

它非常直观和简单。但是当我运行代码时,什么都没有发生,我只是在终端中收到了以下日志消息:

我对这个问题几乎疯了。你能告诉我是什么问题,我该如何解决?提前致谢!

0 投票
1 回答
474 浏览

python - pyquery (lxml) 在结构良好的 XML 文档中找不到标签?

我有一个看起来像这样的 XML 文件。相关位是这样的:

我试图找到该PMID字段的值,使用 PyQuery 来解析 XML:

为什么这不起作用?在控制台中,我看到了reference第一个打印语句的全部内容,后跟两个空值:

如示例代码所示,我可以nct_id很好地使用找到文档中的其他叶节点(如)。.find()

PyQuery 不喜欢大写标签吗?

0 投票
1 回答
496 浏览

python - 如何使用pyquery python触发事件

我正在尝试使用 python 和 pyquery、beautiful soup、requests、mechanize 等包来自动化无头网络浏览器。

但到目前为止,我还没有找到触发按钮点击事件的正确方法。例如,要填写在线表格,我可以在文本字段中插入值,但无法单击提交/发送按钮。

0 投票
1 回答
218 浏览

python - python pyquery导入在Mac OS Sierra上不起作用

我正在尝试导入 pyquery,就像我之前按时做了数百次一样,但它不起作用。它看起来与 Mac OS Sierra 有关。(使用 pip 安装的模块并且是最新的)

命名空间出错

任何想法 ?谢谢 !

0 投票
2 回答
1284 浏览

html - 如何使用 PyQuery 从表中获取文本?

我应该首先说我没有太多使用 pyquery,所以这个问题可能很简单,但是我尝试了很多东西并且被卡住了。

我正在使用 PyQuery 从表中获取信息。这是我表的开头:

它一直在最后一行之后,但这就是所有内容。所以,如果我运行:

我得到:

显然我不想要“无”,因为它不正确。我尝试了各种组合,thead tr td div但我没有得到我得到的组合。然后我尝试先列出 div 列表并通过它们计数以组合列表,但这似乎超级hacky而且我也没有得到Wonderlic。此外,似乎文档说要使用,但是当我尝试添加括号时text(),我得到TypeError: 'NoneType' object is not callable 。任何见解将不胜感激。谢谢!

0 投票
1 回答
296 浏览

jquery - 如何用python读取jquery数据?

我有一个具有以下格式的大 jQuery 数据。

有没有办法用 python 获取第一部分(位置)的上下文?我在PyQuery中尝试了不成功的不同命令。任何人都可以提出解决方案吗?

谢谢

0 投票
2 回答
314 浏览

python - 如何正确使用 PyQuery 遍历?

有一个名为“name.txt”的文件
内容如下

现在我想使用pyquery获取所有输入标签,然后遍历输入标签

使用 '.filter' 获取所有姓名等级和年龄等级

最后,获取姓名和年龄的值,并将所有结果写入一个名为“name_file.txt”的文件中

我的代码如下

但是现在,我遇到了2个问题

1. 我得到的结果不是“Michael:22”,而是“Michael:None”和“None:22”

2.我写入的'name_file'的内容只是'None:None',并不是我得到的所有结果。

0 投票
1 回答
721 浏览

python - pdfquery 不在 BBOX 中返回值

我正在尝试使用 pdfquery 库在 pdf 的所需 bbox 中返回文本。

我首先从返回的页面的左上角定义了 bbox

然后我继续从页面的左下角定义 bbox 并返回类似的。然后我继续定义一个包含整个 8.5" x 11" 页面的 bbox,并返回更多的值而不是所有的文本。我在这里做错了什么吗?我正在关注“快速入门”下的文档。我正在使用 python 2.7