问题标签 [sgml]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
2008 浏览

emacs - 让emacs总是关闭html标签

如何让 emacs 始终关闭 sgml-tag (CcCt)?

例如divh2标签工作正常,但pli不能。基本上我正在寻找一种方法来指定我在插入标签时总是使用 xhtml。

0 投票
4 回答
9322 浏览

xslt - sgml 到 xml 的转换

我的 .sgm 文件中有以下示例 sgml 数据,我想将其转换为 xml

输出应该是这样的:

这可以在 c# 中完成,还是我们可以使用 xslt 2.0 来进行这种转换?

0 投票
3 回答
10265 浏览

python - Python 中的 SGML 解析器

我对 Python 完全陌生。我有以下代码:

它从 SGML 中提取标题元素,但它仅适用于单个标题。我知道我必须重载 unknown_starttag 和 unknown_endtag 才能获得所有标题,但我一直弄错。请帮帮我!!!

0 投票
6 回答
8543 浏览

java - Java中的SGML解析器?

我正在寻找可以解析以 SGML 格式的文档的 Java 解析器。

对于重复的监视器:我知道讨论此主题的另外两个线程: Parsing Java String with SGML Java SGML to XML conversion? 但两者都没有解决方案,因此有了新的话题。

对于将 XML 与 SGML 混淆的人:请阅读以下内容:http ://www.w3.org/TR/NOTE-sgml-xml-971215#null (简而言之,有足够的细微差别至少使其无法使用香草形式)

对于喜欢向 Google 询问海报的人:我已经这样做了,我能想到的最接近的是广受欢迎的 SAXParser:http: //download.oracle.com/javase/1.4.2/docs/api/javax /xml/parsers/SAXParser.html 但这当然是一个 XML 解析器。我正在环顾四周,看看是否有人对 SAX Parser 进行了修改以适应 SGML。

最后,我无法使用 SX,因为我正在寻找 Java 解决方案。

谢谢!:)

0 投票
1 回答
409 浏览

python - 在 python sgmllib 中处理标签

0 投票
3 回答
2873 浏览

java - 用于读取 SGML 文件的 Java 代码

我正在做我的文本分类项目。我的信息检索项目有一个名为 Reuters-21578 的文本分类测试集合。它分布在 22 个文件中。前 21 个文件(reut2-000.sgm 到 reut2-020.sgm)中的每一个都包含 1000 个文档,而最后一个(reut2-021.sgm)包含 578 个文档。文件为 SGML 格式。22 个文件中的每一个都以文档类型声明行开头: DTD 文件 lewis.dtd 包含在分发中。在文档类型声明行之后是用 SGML 标签标记的单独的路透社文章。

我需要帮助来编写一个 java 程序来读取那些 21578 个文档或将它们转换为 21578 个分隔的文本文件。

有人可以帮我吗????

0 投票
4 回答
16515 浏览

html - HTML 是一种上下文无关的语言吗?

阅读一些 相关 问题让我想到了 HTML 的理论性质。

我在这里不是在谈论类似 XHTML 的代码。我说的是这种疯狂的标记之类的东西,它是完全有效的 HTML(!)

那么考虑到 SGML 在这里注入的巨大复杂性,HTML 是一种上下文无关的语言吗?无论如何,它是一种正式的语言吗?有语法吗?

HTML5 怎么样?

我是正式语言概念的新手,所以请多多包涵。是的,我已经阅读了维基百科的文章;)

0 投票
1 回答
815 浏览

php - PHP从字符串中去除非SGML字符?

我的数据库中有非标准字符(由于换行符)。

我的 HTML 验证器正在抱怨它们。

因为我的 HTML 验证器是我自我的直接延伸,所以我想让这件事保持愉快和绿色-ok-arrow-y。

以前做过这个的人有快速修复吗?

顺便说一句,我不想​​更改页面的字符集、文档类型或数据。只是在寻找一种utf8_decode()可以清理字符串的类型,但utf8_encode()不起作用utf8_decode()......

更新

抱歉,“非标准字符”有点含糊,但这个错误警告也是如此。具体来说,它们不是SGML 字符,显然不适合 SGML 解析器……但现在我进入了模糊的领域,不确定发生了什么。

0 投票
1 回答
190 浏览

include - Can I reference an external sgml declaration from within a sgml document?

I'm more used to xml documents and tools, but I need to deal with sgml. I have an sgml document that I'm using nsgmls to parse, and I need to include a particular sgml declaration with it. It works fine if I specify the declaration file on the command line:

But I'd like to include the reference to the declaration within the sgml file (and not the entire declaration). Including it like a xml doctype i.e., <!DOCTYPE MyDoc SYSTEM "mydoc.decl"> fails with

and the declaration isn't parsed (leading to lots of other errors). Trying to do the same thing as a SGML declaration: <!SGML MyDoc SYSTEM "mydoc.decl"> isn't any better, that gives me a fatal error:

Is there any way to just reference the external file, or will I always need to specify it on the command line?

0 投票
2 回答
669 浏览

xml - 声明 DTD 元素类型时“-O”是什么意思?