问题标签 [pyquery]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
python - PyQuery:从 html 中提取 id?
我尝试使用 PyQuery 从 html 文件中获取所有“id”,但带来了麻烦……我试试这个:
但是什么都没有显示...
请帮帮我。
python - 在 lxml 中解析 html 正文片段
我正在尝试解析 html 的片段:
我用lxml.html.fromstring
. 它让我发疯,因为它不断剥去<body>
我碎片的标签:
我也尝试过document_fromstring
, fragment_fromstring
, clean_html
withpage_structure=False
等...没有任何效果。
我需要使用 lxml,因为我将 html 片段传递给 PyQuery。
我只是希望 lxml 不会弄乱我的 html 片段。有可能这样做吗?
python - 无法使用 PyQuery 解析大 HTML
由于我不确定我面临的问题是错误还是我缺乏知识,因此我想寻求您的帮助。
情况是,当尝试使用 PyQuery 解析这个 url ( http://ies.ieee-ies.org/resources/media/publications/TIEpub/1988_2013.htm ) 时,显然它只加载标题,而正文被忽略:
PyQuery 上的 HTML 解析是否有我不知道的大小限制?
PS:我有一个使用不同页面导致相同内容的工作,但我想知道这是什么原因。
python - 使用 PyQuery 要求网页按邮政编码搜索结果
我比较新来爬取数据。
现在我必须使用 Pyquery 通过网站上的邮政编码来抓取美国的学校信息, http://www.greatschools.org/find-schools
每次输入邮政编码时,搜索页面的 URL 都非常复杂。我认为 Pyquery 很难编写这种 url。
例如,当我输入邮政编码 95113 时,结果页面的 url 为 http://www.greatschools.org/search/search.page?lat=37.3326639&lon=-121.89183639999999&state=CA&locationType=postal_code&sortBy =DISTANCE&normalizedAddress=San+Jose%2C+CA+95113&totalResults=1&city=San+Jose&zipCode=95113&locationSearchString=95113&distance=5
我的问题:如果我想从结果页面抓取数据,我该如何使用 Pyquery 获取结果页面?貌似我可以通过编程来制作搜索结果的url,但是创建的时间太长,而且要搜索的邮政编码有数千个。
有没有更好的解决方案?
python - 使用 Python 将整个 JSON 放入一个 SQLite 字段
我有一个很简单的问题。我正在尝试从在线资源中提取 JSON,并将其存储在 SQLite 表中。除了将数据存储在一个丰富的表中,对应于 JSON 中的许多字段,我还想在每次拉取时将整个 JSON 转储到一个表中。
该表如下所示:
我使用以下 python 代码从某个 URL 中提取了一个 JSON:
现在,我想执行以下 INSERT 命令:
但有人告诉我,我提供了不正确的数字绑定(即数千,而不仅仅是 1)。我收集它正在读取 y 变量作为 JSON 的所有不同元素。
有人可以帮我完整地存储 JSON 吗?
此外,由于我显然是这个 JSON 游戏的新手,任何推荐的在线资源都会很棒。
谢谢!
python - pyquery 在打开文件时返回 [None]
base_result.htm
如果我用 pyquery打开一个 html 文件,它会返回[None]
,并在我搜索它时抛出错误。如果我使用相同的文件作为字符串,一切正常。
python - 如何使用 PyQuery 从元标记中获取内容值?
如何content
使用 PyQuery 从这个元标记中获取价值?
python - 如何使用 pyquery 解析 HTML 表格?
如何使用 pyquery 解析 HTML 表格?[参见http://pastie.org/pastes/8556919上的源代码 html 表
结果: {
"category_1":{ "cat1_el1_label":"cat1_el1_value",},
"category_2":{"cat2_el1_label":"cat2_el1_value",},
"category_3":{"cat3_el1_label":"cat3_el1_value",}
}
非常感谢。
python-2.7 - 如何将 Pyquery 与 scrapy 一起使用?
我的目标是将pyquery与scrapy一起使用,显然是从scrapy.selector import PyQuerySelector返回ImportError: cannot import name PyQuerySelector when I crawl the spider。
我按照这个特定的要点https://gist.github.com/joehillen/795180来实现 pyquery。
有什么建议或教程可以帮助我完成这项工作吗?
python - 通过 Pip 安装 PyQuery
我正在尝试通过安装PyQuery
,pip
但我收到一个我不明白的错误。我使用的命令是:
我得到下面的输出:
我觉得这与依赖关系有关,但“pip”不应该自动安装依赖关系吗?