如何将 Html 转换为 Prolog?我需要从 html 页面中提取其标签并将其描述到 Prolog 中。
例如,如果我的文件包含此 html 代码
<title>Prove<title>
<select id="data_nastere_zi" name="data_nastere_zi">
我应该得到
title(Prove),
select(id(data_nastere_zi)).
我试图查看各种图书馆,但我看不到。
谢谢。
您可以使用 SWI-Prolog library(sgml)解析格式良好的 HTML ,特别是load_html/2。
由于错误处理不足,我在抓取“真实世界”网站的经验并不令人愉快。
无论如何,当您加载页面结构时,您将有可用的库(xpath)来检查这些复杂的数据。
编辑在 div 中获取表格:
xpath(Page, //div, Div),
xpath(Div, //table, Table)...
SWI-Prolog 有一个 SGML/XML 解析包,基于 Anjo Anjewierden 到 SP 的 SWI-Prolog 接口:“SWI-Prolog SGML/XML 解析器”。