问题标签 [xidel]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
xml - 如何用 xidel 连接两个提取的值?
我使用以下内容来提取两个值xidel -e
。
'//input[@name="qid"]/@value[1]'
"//span[@id='trueFinalResultCount']"
但我想把这两个结果变成 TSV 格式。
谁能告诉我如何结合以上两个表达式?(我尝试了以下方法。但它不起作用。)
'join((//input[@name="qid"]/@value[1], //span[@id='trueFinalResultCount'][1]), x:cps(9))'
html - 为什么我的 XPath 与正则表达式不匹配?
我想使用 Xidel 选择一个<section>
标签,其中class="body"
if 包含格式中的日期,YYYY.M(M).D(D)
以查找并提取一个具有 8 个字符且可以包含字符和数字的特定字符串。
示例输入 HTML:
命令:
出于某种原因,我无法让这个正则表达式工作。在regex101.com 上它工作正常。
我想获得thi1te_t
最终输出,可能使用正则表达式^.{8}$
和 grep。
xpath - 如何匹配xpath中的尾随文本?
假设我有一些类似上面的 HTML 代码。我想a
通过匹配单词来查找PDF
。text()
在这种情况下不起作用。谁能告诉我匹配尾随文本的正确方法是PDF
什么a
?谢谢。
xquery - 如何使用 xquery 从 html 中提取表单数据?
假设我在 HTML 页面中有上述表单,我想提取要发布的数据abc=xxx&efg=yyy
并将其打印到标准输出。有人知道该怎么做xidel
吗?谢谢。
web-scraping - 如何使用 Xidel 从文件中选择要抓取的行?
如果您有一个file.txt
包含多行文本的文本文件,例如
如何选择要刮掉第 2 行asdasd asdasd
?并稍后选择第 1 行等。
for /f %a in ('^" xidel --data=file.txt --extract=$raw ^"') do set "variable=%a"
仅从第一行中提取第一个单词,它会跳过第一个空格之后的内容?
xidel - 如何绕过 Xidel 上的国家/地区封锁网页?
说我在终端上运行它:
但之后发生的事情是这样的:
Error:
Internet Error: -4
when talking to: https://www.investing.com/currencies/xau-usd
如何绕过该网站并得到我想要的结果?
xpath - Xidel:如何从许多相同的值/类中仅选择 1 个并从结果中删除不需要的元素?
将打印出 3 个相同的输出
那么,我应该怎么做才能只选择其中之一呢?
编辑:
在强类中,值如下所示:
如何仅打印“2020 年 6 月 15 日”?
xpath - Xidel:如何打印出节点而不是值?
html示例:
所以在xidel,我这样做:
我想要的910000
是在data-price
而不是Rp 910.000
我可以这样做吗?
bash - Xidel:如何处理来自一个节点的多个结果?
说,我们有一个代码:
输出是:
我可以在下面做这个吗?
我希望它打印出 3 个编辑过的数字,如下所示:
将网页下载 3 次可能有点荒谬,但这里的原因是使用 ForLoop 将输出的每个值一个一个处理。
xml - 如何使用 xidel 从 XML 中提取数据
我对 xidel 很感兴趣,想将它与 namesilo.com API 一起用于更新 DNS 记录。我在构建正确的选择器时遇到了麻烦。比方说,我有以下 xml 响应,我将如何为主机www.mydomain.org选择 record_id ?
我还没有过去xidel --extract //resource_record
,真的。//resource_record[host="www.mydomain.org"]/record_id
到目前为止,所有类似的尝试都失败了。我猜,通过 grep 和 sed 管道将通过xidel --extract //resource_record | grep www.mydomain.org | sed s/www.mydomain.org.*//
来自 namesilo.com 的原始、未经修饰的 XML 响应来工作,但我确信有更好的方法。