问题标签 [html-parser]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
regex - 如何使用 Perl 有选择地修改 HTML 文档中脚本标签的 src 属性?
我需要在 Perl 中编写一个正则表达式,它将在所有 src 前面加上 [perl]texthere[/perl],如下所示:
有什么帮助吗?谢谢!
objective-c - 使用 HTML 解析器时出错
我正在尝试使用 Objective-C--HMTL Parser (https://github.com/zootreeves/Objective-C-HMTL-Parser)。我仔细遵循了所有说明,在一个新项目中工作正常,但是当我尝试在另一个项目中使用它时,我得到了这些错误:
这两个项目的区别在于第二个我使用“libsqlite3.dylib”。
谢谢,路易吉。
python - 解析 HTML 以获取元素内的文本
我需要将两个元素内的文本转换成一个字符串:
我怎么能做到这一点?
perl - Perl 错误“无法在 Parser.pl 第 6 行的未定义值上调用方法“get_tag””
我写了一个简单的 perl 脚本,但我得到了这个运行时错误:
无法在 Parser.pl 第 6 行的未定义值上调用方法“get_tag”
下面是我的代码:
我在这个 perl 程序的同一目录下放置了一个文件 bad.html。下面是 bad.html 的代码
请帮助我解决运行我的 perl 代码时的错误。
java - java neko html, javax.xml.xpath
Some help with this please:
Any reason why n is null, thanks
java - 如何使用Java获取div的坐标和尺寸
那里
我正在开发一个项目,该项目将使用 JAVA 将 Web 的 html 代码转换为特定的 JS 库,以便 div 块可以具有不同的动态行为。
要将 html div 转换为 JS 对象,我必须知道它的坐标以及宽度和长度。
我变成了几个JAVA html解析器库:http: //java-source.net/open-source/html-parsers
但是除了 Cobra http://lobobrowser.org/cobra/java-html-parser.jsp之外,它们都没有这个功能。它有一个渲染引擎,可以提供 div 的坐标和尺寸。但事实证明这个库确实有问题。我什至无法通过图书馆附带的测试。
有谁知道如何处理这个问题?如果您能提供帮助,我将不胜感激!
提前致谢!菲尔
python - 从 HTML 页面动态提取数据
我正在编写一个脚本以使用此自定义类从 HTML 文档(在本例中为 Nagios 状态页面)中提取一些字符串/数据:
每当找到 <td> 标记时,SGMLParser 就会被调用start_td
并查找该CLASS
属性。
上面列出了在<td>
标签中找到的所有CLASS属性值。有没有办法动态分配td
位(in start_td
)和class
(作为 的值k
),以便使用optparse
,它可以动态分配,如下所示:
而不是静态编码?我打算将此类用于命令行中的任何标记(例如<a>
等<div>
)和相关属性(例如href
等id
)。任何帮助将不胜感激。
html - In which situations, the elements will be attached to Head element of DOM during HTML parsing?
Obviously, the contents/tags within <head></head>
pair will be attached to Head element.
Is there any situation in which during the parsing of <body></body>
, some elements would be attached to Head element, instead of Body element?
perl - 未定义值 HTML::TokeParser
我正在尝试使用 perl 脚本在 html 中查找标签。
我收到此错误无法在 C:\Users\me\Documents\Scripts\parsing.pl 第 9 行的未定义值上调用方法“get_tag”。
salida2.html 与脚本位于同一目录下,我还将它与 WWW::Mechanize::Firefox 实例一起使用,并且运行良好。
先感谢您。
android - 从asynctask android获取字符串
如何从 AsyncTask 中获取字符串?我使用 jsoup 从 URL 中检索内容。在下面的例子中,我得到了内容,但我无法将该内容放入 getItembody 字符串中。代码是:
我的问题是我希望将 doinbackground 中的字符串内容放入字符串名称为正文的 getItemBody 字符串中,并且我想在对话框关闭后得到结果。当前对话框不会自行关闭,但应该在点击键返回。这是来自 logcat Log.v("LogContentView", content);