问题标签 [html-parser]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
2 回答
521 浏览

html - 对一段 html 使用 HtmlTidy Managed

我在.net 中为 HtmlTidy 使用这个库包装器

https://github.com/markbeaton/TidyManaged

它有一个简单的例子:

我想将库用于一段 HTML 而不是带有“html”和“body”标签的完整页面,这可能吗?

我基本上想验证一个开始和结束标签等,并删除没有匹配的标签,任何其他伟大的工具都会很好。

0 投票
1 回答
72 浏览

python - 无法从 html 代码中提取表格

我正在解析下面给出的 html 表(它是完整 html 代码的一部分)但代码不起作用。有人可以帮我吗?有一个错误说“表没有属性findall”。代码是:

0 投票
2 回答
937 浏览

php - 试图获取非对象的属性(解析)

我有一些关于解析的问题,我需要获取照片链接,但代码中有错误。遇到 PHP 错误 严重性:通知消息:尝试获取非对象文件名的属性:views/varle2_view.php 行号:25

网络来源

0 投票
1 回答
515 浏览

java - java html解析器多页表

我正在使用 Jsoup 作为 html 解析器来从本网站的表格中获取所有详细信息。使用下面的代码只能获取第一页上的数据。有什么建议吗?

0 投票
2 回答
160 浏览

ruby-on-rails - 如何从ruby中的字符串中拆分值

我的示例字符串在此处列出。我想将每个值结果拆分为数组或散列以处理每个元素的值。

我如何获取散列或数组中的每个值。

0 投票
1 回答
1823 浏览

java - 使用 jsoup 提交搜索查询

我知道这个问题已经被问过了,但这对我不起作用。实际上在这个站点上,当我什至复制 url 并粘贴到其他选项卡时,它首先显示错误,然后在几秒钟后再次重新加载并显示所需的页面,所以我无法在第一次尝试时获得该值。如果有人能给我任何解决方案,那就太好了。如您所见,如果我犯了任何错误,我对stackoverflow还是很陌生,那么对不起...

0 投票
1 回答
1300 浏览

ruby-on-rails - 使用 Nokogiri 解析 HTML

我有一个 html 文档,我需要抓取某些字符串。该文档是一个 youtube 播放列表。例如:

当我查看 HTML 源代码时,我可以看到我想要的字符串。

字符串是data-video-id引号中的内容。在这个播放列表中有 7 个视频,因此有 7 个代码示例,每个示例都有不同的data-video-id. 如何循环遍历这些字符串并将其保存到@scraped_id变量中?

id 是使用保存的

0 投票
0 回答
783 浏览

c++ - C++ Html 解析器作为 .NET HtmlAgilityPack

我正在将我的应用程序从 C# 移植到 C++,我需要一个可以解析 HTML 并读取 html 元素+它们的属性等的库,基本上是 HtmlAgility 包在 C# 中的所有内容。

我不想在我的 C++ 应用程序中使用 HtmlAgilityPack 或任何其他 .NET。

那么任何人都可以为 C++ 推荐一个好的 Html 解析器吗?速度是重要因素。

0 投票
2 回答
2889 浏览

python - 将 HTML 列表转换为嵌套的 Python 列表

如果我有一个如下所示的嵌套 html(无序列)列表:

如何在 Python 中形成一个嵌套列表?例如:

我认为Beautiful SoupHTML Parser之类的库具有执行此操作的功能,但我无法弄清楚。感谢您的任何帮助/指点!

0 投票
1 回答
140 浏览

perl - 这个 HTML::Parser() 代码在 Perl 中做了什么?

我遇到了一个使用 HTML Parser 的 Perl 代码,如下所示

请帮助我理解这一点。