问题标签 [sgml]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
2 回答
546 浏览

eclipse - Eclipse IDE:SGML 插件?

你知道在 Eclipse 中编辑 SGML 文件的插件吗?

0 投票
3 回答
153 浏览

html - 引用 HTML 属性值

我知道规范允许' 和 " 作为属性值的分隔符,而且我也知道总是引用是一个好习惯。

但是我认为 " 是更清洁的方式,也许只是我在 C 和 C++ 语法中长大。

引用属性值的最简洁方式是什么,为什么?请不要主观回答。

0 投票
5 回答
11568 浏览

python - 使用python获取标签的内容

0 投票
2 回答
2149 浏览

java - 使用 SGML 解析 Java 字符串

我有一个带有 SGML 的 Java 字符串,像这样......

我如何解析它以获取例如说里面的文本<suggestion> </suggestion>以便让“鸭子”出来?

javax.swing.text.html.parser.Parse 会有帮助吗?或者我只能用它解析 HTML 文档?

0 投票
5 回答
516 浏览

html - > 有必要吗?

我现在开发网站和 XML 接口已有 7 年了,从来没有遇到过真正需要使用&gt;for a >. 到目前为止,所有的歧义都可以通过引用,<和单独来处理。&"'

有没有人遇到过这样的情况(例如,与 SGML 处理、浏览器问题、XSLT 等有关),您发现用 转义大于号是必不可少的&gt;

更新:我刚刚检查了XML 规范,其中提到了例如第 2.4 节中的字符数据:

字符数据

所以即使在那里,>除了 CDATA 部分的结束序列之外,也没有提到特别的东西。

在这种情况下, 有>任何意义,将是 CDATA 部分的结尾]]>,但是再一次,如果您引用它,则引号(即文字字符串]]&gt;)将按字面意思出现在输出中(因为它是CDATA)。

0 投票
1 回答
3580 浏览

xml - WYSIWYG XML 编辑器(基于 DTD 或 RelaxNG 或 XSD 的语法)

我需要为自定义 XML 语法制作一个 WYSIWYG XML 编辑器。我已经探索了在该域下可以找到的所有开源工具。包括 VEX、氧气、Bitflux...

它们都没有达到我的目的。

我也在寻找基于 javascript 的 WYSIWYG HTML 编辑器,它可以支持 DTD 或任何语法的附加 DOCTYPE。我已经检查过 FCK 和 CKEditor 以及 TinyMCE 类型的编辑器。

0 投票
1 回答
161 浏览

c# - 删除 SGML 中的多个标签

我有一个 sgml 文件,比如

我的问题是如何删除一个标签<p>并保持另一个标签完好无损......哪个正则表达式是合适的......

0 投票
5 回答
26709 浏览

html - HTML5 文档类型定义在哪里?

“旧” HTML/XHTML 标准为它们定义了一个 DTD(文档类型定义):

HTML 4.01 http://www.w3.org/TR/html401/sgml/dtd.html
XHTML 1.0 http://www.w3.org/TR/xhtml1/dtds.html#a_dtd_XHTML-1.0-Strict

这个 DTD 指定了嵌套元素的规则——“哪些类型的元素可能出现在哪些类型的元素中”。我在这里为 XHTML 1.0 制作了一个图表(抱歉,我不再拥有该资源)

我想用一个新版本更新该图表,其中还包括新的 HTML5 元素。但是,似乎没有 HTML5 DTD。似乎嵌套规则是由 HTML5 中定义的各种内容模型定义的。

所以没有DTD,对吗?

追问: HTML5中没有DTD是有原因的吗?DTD 是一种为所有不同类型元素定义嵌套规则的好方法。他们为什么不包括这样的东西?

更新:我发现这个: http ://www.w3.org/TR/html5/dom.html#kinds-of-content我猜,这是最接近拥有 DTD 的。

更新: Visual Studio 团队为 XHTML5 制作了一个 XML Schema。我想这回答了我的问题:链接

0 投票
1 回答
823 浏览

python - 使用lxml提取预先不知道所有元素的数据

我有一些大致标准化的 sgml 文件。但是,在我打开文件并亲自阅读之前,标签中可能包含我不知道存在的数据。例如,文件有地址,通常地址有街道、城市、州、邮编和电话。地址的每个元素都用标签表示

但是,例如,我发现有 Country、STREET1、STREET2 的标签。我有超过 200K 的文件要处理,我想知道是否可以提取地址的所有元素而不必担心知道未知标签的存在。

到目前为止我所做的是

但是我得到的是有问题的,因为我无法确定一个元素在哪里结束,而下一个元素在哪里开始

0 投票
2 回答
1709 浏览

xml - 解析 LOTS 和 LOTS 格式不太好的 SGML/XML 文档的策略

我有数以千计的 SGML 文档,有些格式正确,有些格式不太好。我需要获取文档中的某些元素,但每次我去加载并尝试将它们读入 XDocument、XMLDocument 甚至只是 StreamReader 时,我都会收到不同的各种 XMLException 错误。

诸如“'[' 是一个意外的标记。”之类的东西。为什么?因为我有一个像 DOCTYPE 这样的文档

而且我了解到“[]”内部需要有一些有效的东西。同样,我不控制文档的创建,但我必须“破解”它们并获取我想要的数据。另一个例子是有一个“未封闭”的元素,例如:

此 XMLException 是“第 27 行的 '连字符' 开始标记与 'Caption' 的结束标记不匹配。第 27 行,位置 58。” 很明显,对吧?

但接下来的问题是,您如何才能在不遇到 XMLExceptions 的情况下真正获得这些文档中的某些 ELEMENTS。SAX 解析器是正确的方法吗?我基本上想打开文档,直接找到我想要的元素(不用担心附近的格式是否正确),提取数据,然后继续。我是否应该忘记使用 XMLDocument、XDocument 进行解析,而只进行简单的字符串替换,例如

然后尝试将其加载到 XML 解析器之一。关于策略的任何提示?