问题标签 [xidel]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
html - 如何从html标签中提取类名
我正在尝试从<span>
标签中提取第二类名称。
由于 xidel 文档真的很差。我不明白如何使用函数filter()
或将标签与类名“userstatus”contains()
匹配<span>
并提取第二个类名。
我现在有这个,但是当一个参数包含单词 userstatus 时,我无法告诉 XIDEL 工具将跨度标签与类匹配。
感谢您的任何建议
我需要提取标签的类参数。
我不需要标签的文本或 HTML 内容。<span>
<span>
结果如下所示:
class="用户状态离线strongfont2 "
class="用户状态在线斜体1 "
linux - Xidel 不断在输出中添加 XMLNS
我正在尝试从 div 中提取 html 代码:
...与 xidel:
出于某种原因,它不断将 XMLNS 属性添加到输出中:
如果我xmlns="http://www.w3.org/1999/xhtml"
从<html>
标签中删除,那就没问题了。
html - 从聊天框中获取链接并将其保存为 CSV 格式的文件
我正在使用“Link Klipper”chrome 扩展程序,使用正则表达式从我的 html 实时 cbox 聊天中获取链接,此扩展程序可以保存 CSV 文件,但有时,它没有按预期工作。
是否有另一种有效的方法,可能使用wget或xidel以正确格式的 CSV 获取链接 + 名称 + 描述 + 大小?或任何受支持的人类可读格式。
html - 如何在 Xidel 输出中添加换行符?
我有我的批处理文件来使用 xidel 获取链接,输出 html 不包含换行符来将每个链接与另一个链接分开
我可以在 xidel 中添加一些东西来用换行符分隔每一行吗?
html - 如何从 Xidel 输出中排除类
我想使用 xpath: //BODY/DIV通过删除包含“AClass”的行来优化我的 Xidel 输出,并仅保留带有“MyClass”的行
我可以在 Xidel 输出文件中添加换行符吗?
windows - xidel如何跟踪分页html并提取URL?
在批处理和 xidel 的 Windows 7 上,我在一个带有分页的网站上进行测试,如下例所示:
链接1
链接2
链接3
1 2 3 4 5 6 7 8 9 10 下一个
我找到了获得前 10 个链接的方法:
但是当我尝试跟随第 2 页或第 (n) 页时
或者
nothink工作,你能给我一些帮助或一些例子吗?
谢谢。
xpath - Xpath 表达式返回空输出
我的 xidel 命令如下:
这应该提取 div 中的所有数据,consulentdetail
我认为没有什么特别的类,但它不会打印任何东西。
谁能帮我找出我的错误?
//编辑:当我在 Firefox 中使用相同的表达式时,它会找到所需的标签
xpath - 即使某些标签不存在,如何在 xpath 中始终拥有相同数量的结果?
我尝试从网站上抓取数据。目标是并非总是提供所有详细信息的站点。例如,一个配置文件已name, birthday
给出,而另一个仅给出name
。
我现在尝试使用 xidel 和 xpath 来掌握这个标签,这就像一个魅力,有时不会有一些标签丢失(因为某些细节不存在)
所以我要求一个解决方案,我可以用一个空的标签填充这些不存在的标签,这样我就可以得到一组长度相同的数据。
之后我将数据转换为 csv,当一个标签丢失时,所有数据都是一列。
我的 xidel 请求如下所示:
有问题的 xpath 表达式是这个:
这或多或少是一个串联
html - XIDEL 将多个 HTML 文件中提取的数据 (div) 导出到新的 HTML 文件中
我想废弃一个多页面的网站并提取特定的 div,然后将其导出到仅以 div 作为内容的 html 页面。
我可以使用 Xidel 使用以下命令从内容中提取数据
是否可以将提取的数据下载到 html 文件中?