问题标签 [xidel]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
1022 浏览

xidel - Collecting data from web sites

I have two web pages

Page 1:

Page 2: http://someUrl.html

I want to crawl page 1 and follow all the links there and generate the following output

How can i achieve this using Xidel?

0 投票
1 回答
1258 浏览

xml - 使用 Xidel 如何从 xml 文件中提取值

在以下 XML 文件中,我想提取值 300。

我尝试了以下代码,但它似乎不起作用。

我将如何提取价值?

0 投票
2 回答
2570 浏览

json - Xidel json xpath - 如何获取多个元素的值

需要使用 Xidel 从 json 数据中获取多个元素的值。单元素查询,如:

工作正常,但谷歌搜索很长时间,无法找到如何构造多元素提取的表达式。以下尝试失败:

0 投票
2 回答
696 浏览

html - 如何更改 Xidel 中导出变量的顺序?

我正在使用Xidel从网页中抓取信息,但我坚持以与页面上不同的顺序导出信息。

例子:

此代码将导出为标题,然后是副标题。西德尔有什么办法可以改变顺序吗?

0 投票
2 回答
1198 浏览

html - 使用 xidel 提取键值对

我在这样的网站上有多个表格:

我想收到这样的东西

我在 xidel 的第一次尝试是xidel --xpath "//table/tr[1]/td[2]" --xpath "//table/tr[2]/td[2]",但这是给

如何在一行中提取两个值?

0 投票
2 回答
709 浏览

bash - Pass external variable to xidel in bash loop script

I try to parse html page using XPath with xidel. The page have a table with multiple rows and columns I need to get values from each row from columns 2 and 5 (IP and port) and store them in csv-like file. Here is my script

The perfomance is not issue When i manually increment each tr - looks perfect. But not with variable from loop. I want to receive a pair of values from each row. Now i got only partial data or even empty file

0 投票
2 回答
468 浏览

json - Xidel:将属性解析为新对象

给出的是来自任何 Java 虚拟机的详细 GC 日志(可以是任何 xml,因此不使用 java 标记):

因此,我想创建一个新对象,该对象在每个垃圾回收周期中重复使用时间戳和使用的字节(总减去空闲)。计算工作得很好,但输出没有。这是我期望得到的:

我尝试了这个命令行,可悲的是它创建了一个空时间戳和一长串堆信息:

输出如下所示:

显然不是我所期望的。

0 投票
1 回答
92 浏览

html - 从站点中查找特定链接

我正在尝试使用 Windows 命令行和工具从网页中查找特定链接。我认为西德尔可以做我想做的事。在页面中,链接是这样使用的:

注意:只有一行这样的。现在,如果我可以设置类似

文件:'{%link}'

然后我就可以提取链接了。另外,如果我想将单词 index.txt 更改为 root.txt 之类的内容,然后使用 aria2 将链接下载为http://link.link/root.txt,我需要做什么?

(我对任何这些工具/命令(如脚本)没有任何经验,我只是想做一些可以做到这一点的东西(一些替代品已经可用,但我想自己做)而且只有这个。所以我确实搜索了它并知道我该怎么做,但提取确切的网址似乎是最难的部分,因为我在 xidel 的文档中找不到任何可能对我有帮助的东西)

0 投票
0 回答
306 浏览

html - Xidel ARM / Raspberry Pi 的实用程序替代品?

你们有谁知道类似 Xidel 的实用程序可以在 ARM 处理器上运行,特别是在 Raspberry Pi 2 Model B 上运行?

我在我的 x86_64 笔记本电脑上创建了一些 Bash 脚本,当它到达时,我将把它放在一个永远在线的 RPI 上,但我刚刚发现没有 ARM 版本的 Xidel,我用它来从中提取数据使用 XPATH 的 HTML 页面。

0 投票
2 回答
380 浏览

xml - 如何获取无效html的xpath?

我正在尝试使用 xidel 从 html 中提取 xpath,最近遇到了无效的 html

我使用 firefox 来获取 xpath,但 firefox 会自动添加缺少的标签,因此 xpath 不匹配

我可以停止firefox,还是你能建议一种方法来解决这个问题?

还有某种反向xpath吗?获取某些文本的 xpath?