问题标签 [sgml]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
58 浏览

unicode - SGML U+1e7c (Ṽ) & U+1e7d (ṽ) 的命名实体?

我需要将命名实体用于特殊字符,但找不到两个字符 U+1e7c (Ṽ) 和 U+1e7d (ṽ) 的任何内容?,我搜索它无法在可用列表中找到任何位置在线. 请帮助。

0 投票
1 回答
41 浏览

xslt - DTD +(标签1,标签2)

我是 DTD 的新手,我不确定我是否正确理解了这段代码。

这段代码是否允许 P 标签包含 tag1、tag2 和 tag3?

0 投票
2 回答
56 浏览

vim - 如何添加 SGML 结束标签?

我有一个 SGML 文件,它看起来有很多<p>带有隐含结束标签的段落,如下所示:

这些段落没有结束标签。我想让它看起来像这样:

有没有使用 OSS 工具的简单方法来做到这一点?(如 vim、sed 等?)

0 投票
1 回答
496 浏览

html - HTML/SGML/XML/DTD 声明中的注释

W3C HTML 4.01 DTD和更早版本中,内联注释经常在声明中使用。

例如,HTML 2.0 Strict DTD有:

其中HTML实体声明包含两个双连字符之间的注释--

但是,DTD 验证器似乎完全拒绝这些内部注释并抛出错误。

验证器是错误的,还是 W3C DTD 格式不正确?


回答:

进一步研究,这似乎是由于SGMLXML规范之间的差异。

本质上,SGML 将注释定义为以声明结构内的任何位置开始和结束,而 XML 要求注释分别以独立的结构和分隔符开始和结束。--<! ><!---->

因为直到 4.01 版的 HTML 都是基于 SGML,所以声明中的注释是允许的,并且被官方 DTD 使用。

然而,大多数 DTD 验证器似乎只检查是否符合更简单的 XML 规范,因此,会被内部声明注释和错误提示弄糊涂。

0 投票
1 回答
1450 浏览

xml - 从 XML 转换为 Microsoft Word Doc

我有一批 XML 和 SGML 文档(大约 7000 个)。我想要将它们转换为结构化 Microsoft Word 文档的东西。我已经在网上阅读了 2 天关于如何做到这一点的内容,并且比我开始时更加困惑。

我看到您可以使用 Open XML SDK 和 C# 使用 Visual Studio 创建它,通过这里的答案:StackOverflow 答案,它链接到这个Using XSLT and Open XML SDK。然而,这是7年前的事了。我不确定这是否仍然是最新的,我不知道这绝对是我需要的。

还有我要转换的文件,标签本身是瑞典语。所以我猜我需要一些东西来阅读标签并将其转换为英文,然后将其转换为 Word XML 格式。

我可以用 C# 和 C++ 编写,如果需要的话,我可能会想办法绕过大多数脚本语言,但是从代码创建 word 文档的经验为零。我知道我可能需要制作 DTD 或 XSLT 并可能使用 Word XML(我在过去 2 天中了解了这些),并在某些 Visual Studio 项目中使用它。

但是我不知道如何实际去做。有人可以引导我朝着正确的方向前进吗?

谢谢

0 投票
1 回答
147 浏览

python -
在 Python SGMLParser 中,如果没有空块,则无法解析“ ”,但“

在 Python SGMLParser 中,我无法解析 ' <br/>' 没有空块,但 ' <br />'。

我可以运行此代码以成功解析 html,但是如果我将标记从 ' <br />' 更改为 ' <br/>' 只是删除空块,则会导致我无法成功解析 html。

除了更换标签外,任何想法解决它?

成功的例子

结果是

['1。微妙的','2。火山',“3。鼓风机的女儿”,'4。炮弹','5。订单箱','6。艾米','7。干杯亲爱的','8。冷水','9。我记得','10。爱斯基摩人']

错误的例子:

结果是:

['1。精美的']

0 投票
1 回答
162 浏览

java - 如果 sgml 中包含特定标签,则使用 java 删除父标签

如果标签中只有注释标签,我想删除父标签。

例子 :

输入:

预期输出:

在上面的例子中,l1item 标签被删除,它只有 note 标签,l2item 没有被删除,因为它有 para 标签,l3item 没有被删除,因为它有 note 标签和 para 标签

所以我的要求就像我想删除 l1item 或 l2item 或 l3item 如果它只有注释标签,并且如果它有一些其他标签或注释标签以及不应该删除的其他标签。

0 投票
1 回答
331 浏览

xml - XML Schema 是 SGML DTD 的子集吗?

XML 是 SGML 的子集。有效的 XML 文档也是有效的 SGML 文档,但反之亦然。

即使我使用 XML 模式而不是 DTD,这是否仍然成立?

怀疑源于这样一个事实,即 XML DTD 是 SGML DTD 的一个子集,但是 XML Schema 允许在 XML DTD 中无法定义的东西。

那么 XML Schema 仍然是一个子集吗?我可以用 SGML DTD 做我用 XML Schema 做的所有事情吗?

0 投票
1 回答
43 浏览

prolog - 如何使用组实现 Xml 代码的谓词以访问 ech 项目、outvar 和运算符?

如何编写 tis 树的谓词?

这些是我的谓词:-

0 投票
3 回答
1638 浏览

perl - 将 .sgm 转换为 .txt

我有一些 .sgm 格式的文件,我必须对它们进行评估(应用语言模型并获得文本的困惑度)。

主要问题是我需要这些纯格式文件,即txt 格式。但是,我一直在互联网上搜索在线转换或执行此操作的某种脚本,但找不到。

除此之外,我的一位老师在 perl 中给我发了这个命令:

我从来没有使用过 perl,老实说,我对此一无所知。我想我已经安装了 perl:

顺便说一句,我使用的是 Mac OS X。

示例 .sgm 文件:

输出 .txt 文件:

UKIP 对艾滋病毒感染者的禁令完美地说明了这一点。你的意思是 Nigel Farage 说 NHS 不应该被用来支付作为健康游客来英国的人,并且当采访者特别询问是否考虑到上述内容时,HIV 感染者是否被包括在不受欢迎的范围内时说是的。你养了一个稻草人,然后带着一丝不苟的恐同症把它打倒。