问题标签 [sgmlreader]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
sgml - SGML(标准通用标记语言)的使用
SGML 是 HTML 和 XML 的超集。有丰富的 HTML 和 XML 解析器可用。你能解释一下吗
在当前业务领域中使用 SGML(示例业务场景)?
是在处理遗留系统时吗?
HTML、xml 文档有 HTML 和 XML 解析器。为什么选择 SGML 解析器?
我的想法可能是错误的,请给我一些反馈?
java - Stax 没有准备好像 """ 这样的字符
我正在使用 Stax 进行 Sgml 解析。Sgml 包含诸如““””之类的字符以及许多其他未替换设置 UTF-8 的字符。解析中断并引发以下异常:
我还有另一个问题,我有一些没有关闭标签的标签,例如<coolspan>
没有 a and tag 。这打破了解析。
我正在考虑创建一种方法来替换所有特殊字符并验证没有结束标签的标签。有人已经通过这样的问题,可以告诉我一个方法吗?
sgmlreader - 使用 SGML Reader 关闭单个 HTML 标签
我正在使用 SgmlReader 从 HTML 生成 XHTML 输出。问题是关于单个 HTML 标签,如
<IMG>
使用 SgmlReader 时,此标签生成为
<IMG></IMG>
我知道这在语法上是正确的,但是,对于 XHTML 样式,我需要知道是否可以生成
<IMG />
反而。
问候詹姆
c# - 如何获取 HTML 文件中的隐藏数据
我尝试使用. C#
但问题是有这个“加载更多评论”按钮,正如它所指的那样,它完成了它的工作,当我查看 Firefox HTML 代码时,突然新<li>
元素突然出现。这些数据是从数据库中获取的还是嵌入在 HTML 文件中?有没有办法获得这些数据?我试过SgmlReader
了,但我无法获得我正在寻找的所有数据。
sgmlreader - 大型文档上的 SgmlReader 无限循环?
我有这个项目可以从 SEC Edgar 网站上抓取数据。部分任务是获取整个文件的内容,我今天只是测试其中的一些内容。
我遇到了这个大约 110 兆的文件(https://www.sec.gov/Archives/edgar/data/355437/000119312520189547/0001193125-20-189547.txt)。
我将包分解为组成 <DOCUMENT> 节点并根据 FILENAME 节点值以不同方式处理它们。对于基于 html/xml 的类型,我只是使用了
抓住内脏,但在这个大文件上,它似乎进入了这个无限循环。在我使用调试器之前,它运行了 15 分钟,然后它就挂在了那个电话上。
有没有人遇到过这种情况?
我正在使用 SqmlReader 1.8.16。
我在变更日志页面上看到一条非常古老的评论,说存在这样一个错误终止 html 评论的错误,但在很多版本之前被列为已修复。
谢谢
dtd - 有没有办法让 ANY 元素能够放置在 SGML DTD 中的任何位置?
我正在为仅修改属性的工具构建 DTD。我不在乎它是否符合 DTD。我希望任何元素都能够成为任何其他元素的子元素。只是为了防止解析器修改数据集。目前,我有任何实体包含完整的元素列表并允许((零个或多个)每个)零次或多次。
python-3.x - 使用漂亮的汤解析 SGML
以下是示例内容:-
我想提取uri的VALUE——“http://sample.com/ceres/wk-us/Concept/i8141
我目前正在尝试使用以下代码:-
我无法弄清楚如何获得确切的价值。任何帮助都感激不尽!!!
.net-core - 为什么使用 Microsoft.Xml.SgmlReader 1.8.18 nuget 构建会输出此警告 MSB2346
我在我的 .Net Core 3.1 项目的几个地方使用Microsoft.Xml.SgmlReader nuget。
构建输出说:
C:\Program Files (x86)\Microsoft Visual Studio\2019\Professional\MSBuild\Current\Bin\Microsoft.Common.CurrentVersion.targets(2123,5): warning MSB3246: Resolved file has a bad image, no metadata, or否则无法访问。无法加载文件或程序集“SgmlReader.exe”或其依赖项之一。该模块应包含程序集清单。
我无法谷歌这到底意味着什么或我如何解决它。也许我应该使用 SgmlReader nuget 的不同化身,只有这个(1.8.18)似乎是最新的。
编辑:没有信息注册。构建(或启动 VS2019)时,融合日志中的 sgmlreader。但我确实在参考文献中注意到了这两个: 编译时程序集、SgmlReader.exe 和 SgmlReaderDll.dll 我可以在 JustDecompile 中打开 SgmlReaderDll.dll,但不能在 SgmlReader.exe 中打开。我还注意到该 exe 是 netcoreapp3.1 的一部分,但不是 netstandard2.0 和 netstandard2.1。这对我来说不合适。