问题标签 [xidel]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
322 浏览

xml - 如何用 xidel 连接两个提取的值?

我使用以下内容来提取两个值xidel -e

  • '//input[@name="qid"]/@value[1]'
  • "//span[@id='trueFinalResultCount']"

但我想把这两个结果变成 TSV 格式。

谁能告诉我如何结合以上两个表达式?(我尝试了以下方法。但它不起作用。)

'join((//input[@name="qid"]/@value[1], //span[@id='trueFinalResultCount'][1]), x:cps(9))'

0 投票
1 回答
155 浏览

html - 为什么我的 XPath 与正则表达式不匹配?

我想使用 Xidel 选择一个<section>标签,其中class="body"if 包含格式中的日期,YYYY.M(M).D(D)以查找并提取一个具有 8 个字符且可以包含字符和数字的特定字符串。

示例输入 HTML:

命令:

出于某种原因,我无法让这个正则表达式工作。在regex101.com 上它工作正常。

我想获得thi1te_t最终输出,可能使用正则表达式^.{8}$和 grep。

0 投票
1 回答
112 浏览

xpath - 如何匹配xpath中的尾随文本?

假设我有一些类似上面的 HTML 代码。我想a通过匹配单词来查找PDFtext()在这种情况下不起作用。谁能告诉我匹配尾随文本的正确方法是PDF什么a?谢谢。

0 投票
1 回答
94 浏览

xquery - 如何使用 xquery 从 html 中提取表单数据?

假设我在 HTML 页面中有上述表单,我想提取要发布的数据abc=xxx&efg=yyy并将其打印到标准输出。有人知道该怎么做xidel吗?谢谢。

0 投票
1 回答
94 浏览

web-scraping - 如何使用 Xidel 从文件中选择要抓取的行?

如果您有一个file.txt包含多行文本的文本文件,例如

如何选择要刮掉第 2 行asdasd asdasd?并稍后选择第 1 行等。

for /f %a in ('^" xidel --data=file.txt --extract=$raw ^"') do set "variable=%a"仅从第一行中提取第一个单词,它会跳过第一个空格之后的内容?

0 投票
1 回答
61 浏览

xidel - 如何绕过 Xidel 上的国家/地区封锁网页?

说我在终端上运行它:

但之后发生的事情是这样的:

Error: Internet Error: -4 when talking to: https://www.investing.com/currencies/xau-usd

如何绕过该网站并得到我想要的结果?

0 投票
1 回答
151 浏览

xpath - Xidel:如何从许多相同的值/类中仅选择 1 个并从结果中删除不需要的元素?

将打印出 3 个相同的输出

那么,我应该怎么做才能只选择其中之一呢?

编辑:

在强类中,值如下所示:

如何仅打印“2020 年 6 月 15 日”?

0 投票
1 回答
58 浏览

xpath - Xidel:如何打印出节点而不是值?

html示例:

所以在xidel,我这样做:

我想要的910000是在data-price而不是Rp 910.000

我可以这样做吗?

0 投票
2 回答
312 浏览

bash - Xidel:如何处理来自一个节点的多个结果?

说,我们有一个代码:

输出是:

我可以在下面做这个吗?

我希望它打印出 3 个编辑过的数字,如下所示:

将网页下载 3 次可能有点荒谬,但这里的原因是使用 ForLoop 将输出的每个值一个一个处理。

0 投票
2 回答
119 浏览

xml - 如何使用 xidel 从 XML 中提取数据

我对 xidel 很感兴趣,想将它与 namesilo.com API 一起用于更新 DNS 记录。我在构建正确的选择器时遇到了麻烦。比方说,我有以下 xml 响应,我将如何为主机www.mydomain.org选择 record_id ?

我还没有过去xidel --extract //resource_record,真的。//resource_record[host="www.mydomain.org"]/record_id到目前为止,所有类似的尝试都失败了。我猜,通过 grep 和 sed 管道将通过xidel --extract //resource_record | grep www.mydomain.org | sed s/www.mydomain.org.*//来自 namesilo.com 的原始、未经修饰的 XML 响应来工作,但我确信有更好的方法。