问题标签 [xidel]

问问题

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

64 问题

0 投票

2 回答

1818 浏览

html - 如何从html标签中提取类名

我正在尝试从<span>标签中提取第二类名称。

由于 xidel 文档真的很差。我不明白如何使用函数filter()或将标签与类名“userstatus”contains() 匹配<span>并提取第二个类名。

我现在有这个，但是当一个参数包含单词 userstatus 时，我无法告诉 XIDEL 工具将跨度标签与类匹配。

感谢您的任何建议

我需要提取标签的类参数。我不需要标签的文本或 HTML 内容。<span>
<span>

结果如下所示：

class="用户状态离线strongfont2 "

class="用户状态在线斜体1 "

2016-01-04T08:42:08.293

0 投票

0 回答

84 浏览

linux - Xidel 不断在输出中添加 XMLNS

我正在尝试从 div 中提取 html 代码：

...与 xidel：

出于某种原因，它不断将 XMLNS 属性添加到输出中：

如果我xmlns="http://www.w3.org/1999/xhtml"从<html>标签中删除，那就没问题了。

linux bash xidel

2016-02-18T18:14:20.973

0 投票

2 回答

153 浏览

html - 从聊天框中获取链接并将其保存为 CSV 格式的文件

我正在使用“Link Klipper”chrome 扩展程序，使用正则表达式从我的 html 实时 cbox 聊天中获取链接，此扩展程序可以保存 CSV 文件，但有时，它没有按预期工作。

是否有另一种有效的方法，可能使用wget或xidel以正确格式的 CSV 获取链接 + 名称 + 描述 + 大小？或任何受支持的人类可读格式。

html csv hyperlink web-scraping xidel

2016-04-26T11:09:07.340

0 投票

1 回答

577 浏览

html - 如何在 Xidel 输出中添加换行符？

我有我的批处理文件来使用 xidel 获取链接，输出 html 不包含换行符来将每个链接与另一个链接分开

我可以在 xidel 中添加一些东西来用换行符分隔每一行吗？

html batch-file xpath web-scraping xidel

2016-04-27T20:06:44.773

0 投票

1 回答

319 浏览

html - 如何从 Xidel 输出中排除类

我想使用 xpath: //BODY/DIV通过删除包含“AClass”的行来优化我的 Xidel 输出，并仅保留带有“MyClass”的行

我可以在 Xidel 输出文件中添加换行符吗？

html web-scraping xidel

2016-04-28T20:59:13.047

0 投票

2 回答

716 浏览

windows - xidel如何跟踪分页html并提取URL？

在批处理和 xidel 的 Windows 7 上，我在一个带有分页的网站上进行测试，如下例所示：

链接1

链接2

链接3

1 2 3 4 5 6 7 8 9 10 下一个

我找到了获得前 10 个链接的方法：

但是当我尝试跟随第 2 页或第 (n) 页时

或者

nothink工作，你能给我一些帮助或一些例子吗？

谢谢。

windows batch-file pagination xidel

2016-05-16T20:34:28.430

0 投票

1 回答

247 浏览

json - 使用 xidel 列出所有 json 指针

是否可以使用xidel或其他命令行工具从文件中列出/生成所有JSON 指针？

我试过了

但它只列出顶级字段，而我想要一个像我得到的那样的递归列表xmlstarlet el -a。

json xidel

eadmaster

2016-06-17T12:17:40.223

0 投票

1 回答

140 浏览

xpath - Xpath 表达式返回空输出

我的 xidel 命令如下：

这应该提取 div 中的所有数据，consulentdetail 我认为没有什么特别的类，但它不会打印任何东西。

谁能帮我找出我的错误？

//编辑：当我在 Firefox 中使用相同的表达式时，它会找到所需的标签

xpath xidel

2016-10-24T14:22:45.607

0 投票

2 回答

211 浏览

xpath - 即使某些标签不存在，如何在 xpath 中始终拥有相同数量的结果？

我尝试从网站上抓取数据。目标是并非总是提供所有详细信息的站点。例如，一个配置文件已name, birthday给出，而另一个仅给出name。

我现在尝试使用 xidel 和 xpath 来掌握这个标签，这就像一个魅力，有时不会有一些标签丢失（因为某些细节不存在）

所以我要求一个解决方案，我可以用一个空的标签填充这些不存在的标签，这样我就可以得到一组长度相同的数据。

之后我将数据转换为 csv，当一个标签丢失时，所有数据都是一列。

我的 xidel 请求如下所示：

有问题的 xpath 表达式是这个：

这或多或少是一个串联

xpath xidel

2016-11-13T12:32:30.390

0 投票

1 回答

205 浏览

html - XIDEL 将多个 HTML 文件中提取的数据 (div) 导出到新的 HTML 文件中

我想废弃一个多页面的网站并提取特定的 div，然后将其导出到仅以 div 作为内容的 html 页面。

我可以使用 Xidel 使用以下命令从内容中提取数据

是否可以将提取的数据下载到 html 文件中？

html xidel

2016-12-19T08:26:07.517

1 2 3 4 5 6 7 8 9 10

问题标签 [xidel]

Reference