问题标签 [html-parser]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
4 回答
355 浏览

regex - 如何使用 Perl 有选择地修改 HTML 文档中脚本标签的 src 属性?

我需要在 Perl 中编写一个正则表达式,它将在所有 src 前面加上 [perl]texthere[/perl],如下所示:

有什么帮助吗?谢谢!

0 投票
1 回答
95 浏览

objective-c - 使用 HTML 解析器时出错

我正在尝试使用 Objective-C--HMTL Parser (https://github.com/zootreeves/Objective-C-HMTL-Parser)。我仔细遵循了所有说明,在一个新项目中工作正常,但是当我尝试在另一个项目中使用它时,我得到了这些错误:

错误截图

这两个项目的区别在于第二个我使用“libsqlite3.dylib”。

谢谢,路易吉。

0 投票
4 回答
98038 浏览

python - 解析 HTML 以获取元素内的文本

我需要将两个元素内的文本转换成一个字符串:

我怎么能做到这一点?

0 投票
1 回答
816 浏览

perl - Perl 错误“无法在 Parser.pl 第 6 行的未定义值上调用方法“get_tag””

我写了一个简单的 perl 脚本,但我得到了这个运行时错误:

无法在 Parser.pl 第 6 行的未定义值上调用方法“get_tag”

下面是我的代码:

我在这个 perl 程序的同一目录下放置了一个文件 bad.html。下面是 bad.html 的代码

请帮助我解决运行我的 perl 代码时的错误。

0 投票
1 回答
739 浏览

java - java neko html, javax.xml.xpath

Some help with this please:

Any reason why n is null, thanks

0 投票
1 回答
171 浏览

java - 如何使用Java获取div的坐标和尺寸

那里

我正在开发一个项目,该项目将使用 JAVA 将 Web 的 html 代码转换为特定的 JS 库,以便 div 块可以具有不同的动态行为。

要将 html div 转换为 JS 对象,我必须知道它的坐标以及宽度和长度。

我变成了几个JAVA html解析器库:http: //java-source.net/open-source/html-parsers

但是除了 Cobra http://lobobrowser.org/cobra/java-html-parser.jsp之外,它们都没有这个功能。它有一个渲染引擎,可以提供 div 的坐标和尺寸。但事实证明这个库确实有问题。我什至无法通过图书馆附带的测试。

有谁知道如何处理这个问题?如果您能提供帮助,我将不胜感激!

提前致谢!菲尔

0 投票
1 回答
536 浏览

python - 从 HTML 页面动态提取数据

我正在编写一个脚本以使用此自定义类从 HTML 文档(在本例中为 Nagios 状态页面)中提取一些字符串/数据:

每当找到 <td> 标记时,SGMLParser 就会被调用start_td并查找该CLASS属性。

上面列出了在<td>标签中找到的所有CLASS属性值。有没有办法动态分配td位(in start_td)和class(作为 的值k),以便使用optparse,它可以动态分配,如下所示:

而不是静态编码?我打算将此类用于命令行中的任何标记(例如<a><div>)和相关属性(例如hrefid)。任何帮助将不胜感激。

0 投票
1 回答
35 浏览

html - In which situations, the elements will be attached to Head element of DOM during HTML parsing?

Obviously, the contents/tags within <head></head> pair will be attached to Head element.

Is there any situation in which during the parsing of <body></body>, some elements would be attached to Head element, instead of Body element?

0 投票
1 回答
129 浏览

perl - 未定义值 HTML::TokeParser

我正在尝试使用 perl 脚本在 html 中查找标签。

我收到此错误无法在 C:\Users\me\Documents\Scripts\parsing.pl 第 9 行的未定义值上调用方法“get_tag”。

salida2.html 与脚本位于同一目录下,我还将它与 WWW::Mechanize::Firefox 实例一起使用,并且运行良好。

先感谢您。

0 投票
5 回答
411 浏览

android - 从asynctask android获取字符串

如何从 AsyncTask 中获取字符串?我使用 jsoup 从 URL 中检索内容。在下面的例子中,我得到了内容,但我无法将该内容放入 getItembody 字符串中。代码是:

我的问题是我希望将 doinbackground 中的字符串内容放入字符串名称为正文的 getItemBody 字符串中,并且我想在对话框关闭后得到结果。当前对话框不会自行关闭,但应该在点击键返回。这是来自 logcat Log.v("LogContentView", content);