问题标签 [pyquery]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
1245 浏览

python - PyQuery:从 html 中提取 id?

我尝试使用 PyQuery 从 html 文件中获取所有“id”,但带来了麻烦……我试试这个:

但是什么都没有显示...

请帮帮我。

0 投票
1 回答
3173 浏览

python - 在 lxml 中解析 html 正文片段

我正在尝试解析 html 的片段:

我用lxml.html.fromstring. 它让我发疯,因为它不断剥去<body>我碎片的标签:

我也尝试过document_fromstring, fragment_fromstring, clean_htmlwithpage_structure=False等...没有任何效果。

我需要使用 lxml,因为我将 html 片段传递给 PyQuery。

我只是希望 lxml 不会弄乱我的 html 片段。有可能这样做吗?

0 投票
1 回答
322 浏览

python - 无法使用 PyQuery 解析大 HTML

由于我不确定我面临的问题是错误还是我缺乏知识,因此我想寻求您的帮助。

情况是,当尝试使用 PyQuery 解析这个 url ( http://ies.ieee-ies.org/resources/media/publications/TIEpub/1988_2013.htm ) 时,显然它只加载标题,而正文被忽略:

PyQuery 上的 HTML 解析是否有我不知道的大小限制?

PS:我有一个使用不同页面导致相同内容的工作,但我想知道这是什么原因。

0 投票
1 回答
166 浏览

python - 使用 PyQuery 要求网页按邮政编码搜索结果

我比较新来爬取数据。

现在我必须使用 Pyquery 通过网站上的邮政编码来抓取美国的学校信息, http://www.greatschools.org/find-schools

每次输入邮政编码时,搜索页面的 URL 都非常复杂。我认为 Pyquery 很难编写这种 url。

例如,当我输入邮政编码 95113 时,结果页面的 url 为 http://www.greatschools.org/search/search.page?lat=37.3326639&lon=-121.89183639999999&state=CA&locationType=postal_code&sortBy =DISTANCE&normalizedAddress=San+Jose%2C+CA+95113&totalResults=1&city=San+Jose&zipCode=95113&locationSearchString=95113&distance=5

我的问题:如果我想从结果页面抓取数据,我该如何使用 Pyquery 获取结果页面?貌似我可以通过编程来制作搜索结果的url,但是创建的时间太长,而且要搜索的邮政编码有数千个。

有没有更好的解决方案?

0 投票
2 回答
5956 浏览

python - 使用 Python 将整个 JSON 放入一个 SQLite 字段

我有一个很简单的问题。我正在尝试从在线资源中提取 JSON,并将其存储在 SQLite 表中。除了将数据存储在一个丰富的表中,对应于 JSON 中的许多字段,我还想在每次拉取时将整个 JSON 转储到一个表中。

该表如下所示:

我使用以下 python 代码从某个 URL 中提取了一个 JSON:

现在,我想执行以下 INSERT 命令:

但有人告诉我,我提供了不正确的数字绑定(即数千,而不仅仅是 1)。我收集它正在读取 y 变量作为 JSON 的所有不同元素。

有人可以帮我完整地存储 JSON 吗?

此外,由于我显然是这个 JSON 游戏的新手,任何推荐的在线资源都会很棒。

谢谢!

0 投票
1 回答
819 浏览

python - pyquery 在打开文件时返回 [None]

base_result.htm如果我用 pyquery打开一个 html 文件,它会返回[None],并在我搜索它时抛出错误。如果我使用相同的文件作为字符串,一切正常。

0 投票
1 回答
903 浏览

python - 如何使用 PyQuery 从元标记中获取内容值?

如何content使用 PyQuery 从这个元标记中获取价值?

0 投票
2 回答
2133 浏览

python - 如何使用 pyquery 解析 HTML 表格?

如何使用 pyquery 解析 HTML 表格?[参见http://pastie.org/pastes/8556919上的源代码 html 表

结果: {

"category_1":{ "cat1_el1_label":"cat1_el1_value",},

"category_2":{"cat2_el1_label":"cat2_el1_value",},

"category_3":{"cat3_el1_label":"cat3_el1_value",}

}

非常感谢。

0 投票
1 回答
843 浏览

python-2.7 - 如何将 Pyquery 与 scrapy 一起使用?

我的目标是将pyquery与scrapy一起使用,显然是从scrapy.selector import PyQuerySelector返回ImportError: cannot import name PyQuerySelector when I crawl the spider。

我按照这个特定的要点https://gist.github.com/joehillen/795180来实现 pyquery。

有什么建议或教程可以帮助我完成这项工作吗?

0 投票
2 回答
12980 浏览

python - 通过 Pip 安装 PyQuery

我正在尝试通过安装PyQuerypip但我收到一个我不明白的错误。我使用的命令是:

我得到下面的输出:

我觉得这与依赖关系有关,但“pip”不应该自动安装依赖关系吗?