问题标签 [xidel]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
2 回答
1818 浏览

html - 如何从html标签中提取类名

我正在尝试从<span>标签中提取第二类名称。

由于 xidel 文档真的很差。我不明白如何使用函数filter()或将标签与类名“userstatus”contains() 匹配<span>并提取第二个类名。

我现在有这个,但是当一个参数包含单词 userstatus 时,我无法告诉 XIDEL 工具将跨度标签与类匹配。

感谢您的任何建议

我需要提取标签的类参数。 我不需要标签的文本或 HTML 内容。<span>
<span>

结果如下所示:

class="用户状态离线strongfont2 "

class="用户状态在线斜体1 "

0 投票
0 回答
84 浏览

linux - Xidel 不断在输出中添加 XMLNS

我正在尝试从 div 中提取 html 代码:

...与 xidel:

出于某种原因,它不断将 XMLNS 属性添加到输出中:

如果我xmlns="http://www.w3.org/1999/xhtml"<html>标签中删除,那就没问题了。

0 投票
2 回答
153 浏览

html - 从聊天框中获取链接并将其保存为 CSV 格式的文件

我正在使用“Link Klipper”chrome 扩展程序,使用正则表达式从我的 html 实时 cbox 聊天中获取链接,此扩展程序可以保存 CSV 文件,但有时,它没有按预期工作。

是否有另一种有效的方法,可能使用wgetxidel以正确格式的 CSV 获取链接 + 名称 + 描述 + 大小?或任何受支持的人类可读格式。

0 投票
1 回答
577 浏览

html - 如何在 Xidel 输出中添加换行符?

我有我的批处理文件来使用 xidel 获取链接,输出 html 不包含换行符来将每个链接与另一个链接分开

我可以在 xidel 中添加一些东西来用换行符分隔每一行吗?

0 投票
1 回答
319 浏览

html - 如何从 Xidel 输出中排除类

我想使用 xpath: //BODY/DIV通过删除包含“AClass”的行来优化我的 Xidel 输出,并仅保留带有“MyClass”的行

我可以在 Xidel 输出文件中添加换行符吗?

0 投票
2 回答
716 浏览

windows - xidel如何跟踪分页html并提取URL?

在批处理和 xidel 的 Windows 7 上,我在一个带有分页的网站上进行测试,如下例所示:

链接1

链接2

链接3

1 2 3 4 5 6 7 8 9 10 下一个

我找到了获得前 10 个链接的方法:

但是当我尝试跟随第 2 页或第 (n) 页时

或者

nothink工作,你能给我一些帮助或一些例子吗?

谢谢。

0 投票
1 回答
247 浏览

json - 使用 xidel 列出所有 json 指针

是否可以使用xidel或其他命令行工具从文件中列出/生成所有JSON 指针?

我试过了

但它只列出顶级字段,而我想要一个像我得到的那样的递归列表xmlstarlet el -a

0 投票
1 回答
140 浏览

xpath - Xpath 表达式返回空输出

我的 xidel 命令如下:

这应该提取 div 中的所有数据,consulentdetail 我认为没有什么特别的类,但它不会打印任何东西。

谁能帮我找出我的错误?

//编辑:当我在 Firefox 中使用相同的表达式时,它会找到所需的标签

0 投票
2 回答
211 浏览

xpath - 即使某些标签不存在,如何在 xpath 中始终拥有相同数量的结果?

我尝试从网站上抓取数据。目标是并非总是提供所有详细信息的站点。例如,一个配置文件已name, birthday给出,而另一个仅给出name

我现在尝试使用 xidel 和 xpath 来掌握这个标签,这就像一个魅力,有时不会有一些标签丢失(因为某些细节不存在)

所以我要求一个解决方案,我可以用一个空的标签填充这些不存在的标签,这样我就可以得到一组长度相同的数据。

之后我将数据转换为 csv,当一个标签丢失时,所有数据都是一列。

我的 xidel 请求如下所示:

有问题的 xpath 表达式是这个:

这或多或少是一个串联

0 投票
1 回答
205 浏览

html - XIDEL 将多个 HTML 文件中提取的数据 (div) 导出到新的 HTML 文件中

我想废弃一个多页面的网站并提取特定的 div,然后将其导出到仅以 div 作为内容的 html 页面。

我可以使用 Xidel 使用以下命令从内容中提取数据

是否可以将提取的数据下载到 html 文件中?