问题标签 [sgml]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
unicode - SGML U+1e7c (Ṽ) & U+1e7d (ṽ) 的命名实体?
我需要将命名实体用于特殊字符,但找不到两个字符 U+1e7c (Ṽ) 和 U+1e7d (ṽ) 的任何内容?,我搜索它无法在可用列表中找到任何位置在线. 请帮助。
xslt - DTD +(标签1,标签2)
我是 DTD 的新手,我不确定我是否正确理解了这段代码。
这段代码是否允许 P 标签包含 tag1、tag2 和 tag3?
vim - 如何添加 SGML 结束标签?
我有一个 SGML 文件,它看起来有很多<p>
带有隐含结束标签的段落,如下所示:
这些段落没有结束标签。我想让它看起来像这样:
有没有使用 OSS 工具的简单方法来做到这一点?(如 vim、sed 等?)
html - HTML/SGML/XML/DTD 声明中的注释
在W3C HTML 4.01 DTD和更早版本中,内联注释经常在声明中使用。
例如,HTML 2.0 Strict DTD有:
其中HTML
实体声明包含两个双连字符之间的注释--
。
但是,DTD 验证器似乎完全拒绝这些内部注释并抛出错误。
验证器是错误的,还是 W3C DTD 格式不正确?
回答:
进一步研究,这似乎是由于SGML和XML规范之间的差异。
本质上,SGML 将注释定义为以声明结构内的任何位置开始和结束,而 XML 要求注释分别以独立的结构和分隔符开始和结束。--
<! >
<!--
-->
因为直到 4.01 版的 HTML 都是基于 SGML,所以声明中的注释是允许的,并且被官方 DTD 使用。
然而,大多数 DTD 验证器似乎只检查是否符合更简单的 XML 规范,因此,会被内部声明注释和错误提示弄糊涂。
xml - 从 XML 转换为 Microsoft Word Doc
我有一批 XML 和 SGML 文档(大约 7000 个)。我想要将它们转换为结构化 Microsoft Word 文档的东西。我已经在网上阅读了 2 天关于如何做到这一点的内容,并且比我开始时更加困惑。
我看到您可以使用 Open XML SDK 和 C# 使用 Visual Studio 创建它,通过这里的答案:StackOverflow 答案,它链接到这个Using XSLT and Open XML SDK。然而,这是7年前的事了。我不确定这是否仍然是最新的,我不知道这绝对是我需要的。
还有我要转换的文件,标签本身是瑞典语。所以我猜我需要一些东西来阅读标签并将其转换为英文,然后将其转换为 Word XML 格式。
我可以用 C# 和 C++ 编写,如果需要的话,我可能会想办法绕过大多数脚本语言,但是从代码创建 word 文档的经验为零。我知道我可能需要制作 DTD 或 XSLT 并可能使用 Word XML(我在过去 2 天中了解了这些),并在某些 Visual Studio 项目中使用它。
但是我不知道如何实际去做。有人可以引导我朝着正确的方向前进吗?
谢谢
python -
在 Python SGMLParser 中,如果没有空块,则无法解析“ ”,但“
”
在 Python SGMLParser 中,我无法解析 ' <br/>
' 没有空块,但 ' <br />
'。
我可以运行此代码以成功解析 html,但是如果我将标记从 ' <br />
' 更改为 ' <br/>
' 只是删除空块,则会导致我无法成功解析 html。
除了更换标签外,任何想法解决它?
成功的例子。
结果是:
['1。微妙的','2。火山',“3。鼓风机的女儿”,'4。炮弹','5。订单箱','6。艾米','7。干杯亲爱的','8。冷水','9。我记得','10。爱斯基摩人']
错误的例子:
结果是:
['1。精美的']
java - 如果 sgml 中包含特定标签,则使用 java 删除父标签
如果标签中只有注释标签,我想删除父标签。
例子 :
输入:
预期输出:
在上面的例子中,l1item 标签被删除,它只有 note 标签,l2item 没有被删除,因为它有 para 标签,l3item 没有被删除,因为它有 note 标签和 para 标签
所以我的要求就像我想删除 l1item 或 l2item 或 l3item 如果它只有注释标签,并且如果它有一些其他标签或注释标签以及不应该删除的其他标签。
xml - XML Schema 是 SGML DTD 的子集吗?
XML 是 SGML 的子集。有效的 XML 文档也是有效的 SGML 文档,但反之亦然。
即使我使用 XML 模式而不是 DTD,这是否仍然成立?
怀疑源于这样一个事实,即 XML DTD 是 SGML DTD 的一个子集,但是 XML Schema 允许在 XML DTD 中无法定义的东西。
那么 XML Schema 仍然是一个子集吗?我可以用 SGML DTD 做我用 XML Schema 做的所有事情吗?
prolog - 如何使用组实现 Xml 代码的谓词以访问 ech 项目、outvar 和运算符?
如何编写 tis 树的谓词?
这些是我的谓词:-
perl - 将 .sgm 转换为 .txt
我有一些 .sgm 格式的文件,我必须对它们进行评估(应用语言模型并获得文本的困惑度)。
主要问题是我需要这些纯格式文件,即txt 格式。但是,我一直在互联网上搜索在线转换或执行此操作的某种脚本,但找不到。
除此之外,我的一位老师在 perl 中给我发了这个命令:
我从来没有使用过 perl,老实说,我对此一无所知。我想我已经安装了 perl:
顺便说一句,我使用的是 Mac OS X。
示例 .sgm 文件:
输出 .txt 文件:
UKIP 对艾滋病毒感染者的禁令完美地说明了这一点。你的意思是 Nigel Farage 说 NHS 不应该被用来支付作为健康游客来英国的人,并且当采访者特别询问是否考虑到上述内容时,HIV 感染者是否被包括在不受欢迎的范围内时说是的。你养了一个稻草人,然后带着一丝不苟的恐同症把它打倒。