问题标签 [tei]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
1405 浏览

xml - 使用父节点属性将 XML 加载到 R 中的 Dataframe

我有一个 XML 文件(TEI 编码的播放),我想将它处理成 R 中的 data.frame,其中 data.frame 的每一行都包含播放的一行、行号、该行的扬声器,场景编号和场景类型。XML 文件的正文如下所示(但更长):

该问题似乎与此处此处提出的问题相似,但我的 XML 文件的结构略有不同,因此两者都没有给我一个可行的解决方案。我设法做到了:

这将返回一个完整的“场景编号”、“场景类型”和“扬声器”的 data.frame,但我无法弄清楚如何将其分解为每一行(并获取相关的行号)。

我尝试将文件作为列表导入(通过 xmlToList),但这给了我一个非常混乱的列表列表,如果我尝试使用 for 循环访问不同的元素,它也会导致很多不同的错误(可怕想法,我知道!)。

理想情况下,我正在寻找一种解决方案,该解决方案既可以处理完整的文件,也可以处理其他类似结构的 XML 文件。

我刚刚开始使用 R 并且完全不知所措。您可以提供的任何帮助将不胜感激。

谢谢你的帮助!

编辑:此处提供完整 xml 文件的副本。

0 投票
1 回答
156 浏览

sgml - TEI 格式与 SGML 格式

谁能解释TEISGML格式之间的区别和/或它们之间的关系?

0 投票
1 回答
59 浏览

html - TEI 翻译无法识别

标签

我得到了一个 TEI xml 电子表格,我需要为它制作一个布局。我目前最大的问题是格式使用 p 标签来分解文本。但是,当我将 xml 解析为 html 时,标签不存在,而是文档中存在间距。

以下是我正在尝试输出的模型,是的,它现在非常缺乏:

这是我试图解释的 xml

这是翻译后的html。您可以看到 p 标签曾经在哪里,但现在是大空格:

所需的输出,但我也希望能够识别所有引用、原件、注册和名称标签:

我真的需要一些帮助。此外,如果您知道用于解释 TEI 的良好教程或文档,我将不胜感激!

0 投票
1 回答
692 浏览

html - 使用字符串长度条件在 XSLT 中将 XML 转换为 HTML

我有一个使用 TEI 构建的 XML 文件,如下所示:

我需要将其转换为这种 HTML 结构:

现在我使用这个 XSLT 文件:

我的问题是我需要创建一个新的<div class="book-content">foreach 900 个字符。但我不想削减我的元素,所以我需要计算我必须在一个元素中包含s多少个元素才能拥有大约 900 个字符。s<div class="book-content">

0 投票
1 回答
102 浏览

xml - 两个 xml tei 文件之间的交叉引用

我有一个这样的第一个 XML TEI 文件:

然后,我有第二个这样的 XML TEI 文件:

第二个文件包含对第一个文件的一些解释。我想知道是否可以在这两个文件之间进行交叉引用?在 XML 中执行此操作的常用/最佳方法是什么?TEI 有什么特别的吗?

0 投票
1 回答
83 浏览

xslt - xslt 身份转换的奇怪行为

我在 xslt 转换中遇到了一些奇怪的问题,这可能是一个真正的问题,或者可能只是我忘记了一些东西。任何附加了 xsl:apply-templates 的东西都会导致空白,我不明白为什么。

我使用的xml如下:

我申请的xslt如下:

我希望我的结果是 TEI.2 转换为 TEI 并添加了命名空间的原始 XML:

相反,TEI.2 按预期更改为 TEI,但 teiHeader 未出现:

我确定我犯了错误或忽略了某些东西,但我终其一生都无法弄清楚它是什么。如果有人能告诉我什么让我搞砸了以及如何纠正它,我将不胜感激。

0 投票
1 回答
2245 浏览

xml - 使用 xml2 从 TEI XML 创建数据框

xml2我正在尝试使用 Hadley Wickham 的包创建一个 TEI-XML 版本的 Moby Dick 的数据框。我希望数据框最终看起来像这样(对于小说中的所有单词):

我可以得到碎片,但不是全部。这是我到目前为止所得到的:

这给了我们一个长度为 134 的列表(即每一章)。我们可以获得特定元素的章节编号,如下所示:

我们可以得到特定章节的段落(即减去章节标题)如下:

我们可以得到章节的单词如下:

我不知道如何获得每个单词的章节号。我有一个有效的玩具示例:

但它不适用于更长的示例

(我知道为什么玩具示例有效,但梅尔维尔的示例无效,但我想包含它以显示我正在尝试做的事情)。我猜我可能需要某种循环,但我不确定从哪里开始。有什么建议么?

PS:我不完全确定我是否应该链接到我在 Github 上找到的 Moby Dick 的 xml 版本,但你可以很容易地在搜索melville1.xml.

0 投票
1 回答
319 浏览

xml - 前同级和后同级不使用附加元素

我首先要为这个问题的长度道歉,但希望提供这些信息会有所帮助。

我试图在多个 xml 文档上使用单个 xsl,它适用于我的原始文档(房间中四面墙的文本,每面墙都表示为一个 TEI surfaceGrp 元素)。但是,现在我需要修改 xsl 来处理一个额外的 TEI surfaceGrp 元素,代表一个写入页面的两侧,然后是页面的集合。

我的四面墙的原始 xml 代码是这样的:

我转换为以下 html

通过这个 xsl:

当我使用额外的 surfaceGrp 元素在新文档上运行它时,

我只得到一页的信息。这是有道理的,因为页面适合与原始代码中墙壁相同的 surfaceGrp 插槽。但是当我尝试修改代码以向上移动到页面集合级别时

我得到相同的结果。我不知道为什么。我显然不像我想象的那样理解前兄弟姐妹和后兄弟姐妹,如果有一种更简洁的方法来完成我想要的事情,我会很乐意使用它。

0 投票
2 回答
706 浏览

xml - 使用 XSLT 将多个 XML 文件按日期排序并合并为一个

我有几个包含 TEI 中历史字母的单个 XML 文件。现在我想将它们合并到一个以日期为标准的文件中。

A1.xml

和第二个文件 A2.xml:

第三个,A3.xml:

这些文件以连续的文件名“A001.xml”到“A999.xml”命名,但不是按所需顺序命名的。所以我更喜欢的输出是单个文件 letters.xml:

尽管我找到了将多个 XML 文件合并为一个的方法,但我无法使用排序标准让它工作。这甚至可能吗?

0 投票
0 回答
45 浏览

xml - 在兄弟节点中的嵌套项之间移动的最佳方式?

我有一个问题,我确信它实际上很容易回答,但我无法弄清楚,而且我之前尝试询问它的尝试过于复杂。

我有一个从 TEI XML 生成的页面,其中包含一些与图像文件相关联的文本:

(我已从此处的示例中删除了文本以避免额外的麻烦)

我根据与每条文本相关联的图像的缩略图在页面顶部生成一个标题。所以www_test_1-thumbnail.jpg,等等。使用下面的 xsl,我可以让标题正确显示(tei 是 tei 命名空间,可以在 处声明xmlns:tei="http://www.tei-c.org/ns/1.0"):

我的问题是有时我需要从一<surfaceGrp>组元素跳到另一组元素。因此,例如,如果有一个“南墙” <surfaceGrp>,我需要能够获取即将到来的元素的 url,以便我可以跳转到下一个缩略图块:

让事情变得更加复杂的是,有时所有东西都必须被包装在另一个<surfaceGrp>元素中,因为它们是一个更大的块的一部分。这可能看起来像这样:

所以我的问题是双重的:

  1. 如何让我的 xsl 显示第一<surfaceGrp>棵树中的所有内容?我当前的代码将为孩子显示两个表面,<surfaceGrp>但不是全部。
  2. 在上面的示例中,我将如何生成从第 66 节到第 68 节的链接,它与从第 65 节到第 66 节的链接有根本的不同吗?我可以使用我拥有的一些复杂的代码跳到下一个项目和下一个项目<surfaceGrp>,但这是一个令人难以置信的错误解决方案,并且一旦<surfaceGrp>添加第二层就会完全中断。如果有一个标准的解决方案,我将不胜感激朝正确的方向点头。

xsl当前使用我的代码生成的html代码如下: