问题标签 [html-parser]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
html - 对一段 html 使用 HtmlTidy Managed
我在.net 中为 HtmlTidy 使用这个库包装器
https://github.com/markbeaton/TidyManaged
它有一个简单的例子:
我想将库用于一段 HTML 而不是带有“html”和“body”标签的完整页面,这可能吗?
我基本上想验证一个开始和结束标签等,并删除没有匹配的标签,任何其他伟大的工具都会很好。
python - 无法从 html 代码中提取表格
我正在解析下面给出的 html 表(它是完整 html 代码的一部分)但代码不起作用。有人可以帮我吗?有一个错误说“表没有属性findall”。代码是:
php - 试图获取非对象的属性(解析)
我有一些关于解析的问题,我需要获取照片链接,但代码中有错误。遇到 PHP 错误 严重性:通知消息:尝试获取非对象文件名的属性:views/varle2_view.php 行号:25
网络来源
java - java html解析器多页表
我正在使用 Jsoup 作为 html 解析器来从本网站的表格中获取所有详细信息。使用下面的代码只能获取第一页上的数据。有什么建议吗?
ruby-on-rails - 如何从ruby中的字符串中拆分值
我的示例字符串在此处列出。我想将每个值结果拆分为数组或散列以处理每个元素的值。
我如何获取散列或数组中的每个值。
java - 使用 jsoup 提交搜索查询
我知道这个问题已经被问过了,但这对我不起作用。实际上在这个站点上,当我什至复制 url 并粘贴到其他选项卡时,它首先显示错误,然后在几秒钟后再次重新加载并显示所需的页面,所以我无法在第一次尝试时获得该值。如果有人能给我任何解决方案,那就太好了。如您所见,如果我犯了任何错误,我对stackoverflow还是很陌生,那么对不起...
ruby-on-rails - 使用 Nokogiri 解析 HTML
我有一个 html 文档,我需要抓取某些字符串。该文档是一个 youtube 播放列表。例如:
当我查看 HTML 源代码时,我可以看到我想要的字符串。
字符串是data-video-id
引号中的内容。在这个播放列表中有 7 个视频,因此有 7 个代码示例,每个示例都有不同的data-video-id
. 如何循环遍历这些字符串并将其保存到@scraped_id
变量中?
id 是使用保存的
c++ - C++ Html 解析器作为 .NET HtmlAgilityPack
我正在将我的应用程序从 C# 移植到 C++,我需要一个可以解析 HTML 并读取 html 元素+它们的属性等的库,基本上是 HtmlAgility 包在 C# 中的所有内容。
我不想在我的 C++ 应用程序中使用 HtmlAgilityPack 或任何其他 .NET。
那么任何人都可以为 C++ 推荐一个好的 Html 解析器吗?速度是重要因素。
python - 将 HTML 列表转换为嵌套的 Python 列表
如果我有一个如下所示的嵌套 html(无序列)列表:
如何在 Python 中形成一个嵌套列表?例如:
我认为Beautiful Soup和HTML Parser之类的库具有执行此操作的功能,但我无法弄清楚。感谢您的任何帮助/指点!
perl - 这个 HTML::Parser() 代码在 Perl 中做了什么?
我遇到了一个使用 HTML Parser 的 Perl 代码,如下所示
请帮助我理解这一点。