在对 XSLT 进行了几个小时的研究之后,我承认失败了!我需要修复大量从未命名的翻译工具返回给我们的 .xlf XLIFF 翻译文件。理想情况下,我会使用批处理工具将 XSL 转换应用于它们。
下面是其中一个 XLIFF 文件的片段:
<body>
<trans-unit id="1" phase-name="pretrans" restype="x-h3">
<source>Adding, Deleting or Modifying Notes in the Call Description</source>
<seg-source>Adding, Deleting or Modifying Notes in the Call Description</seg-source>
<target state="final">Добавление, удаление и изменение примечаний в описании звонка</target>
</trans-unit>
<trans-unit id="2" phase-name="pretrans" restype="x-p">
<source>Description of Fields on RHS</source>
<seg-source>Description of Fields on RHS</seg-source>
<target state="final">Поле описания в правой части</target>
</trans-unit>
<trans-unit id="3" phase-name="pretrans" restype="x-p">
<source>You can add descriptive text notes to a call recording, if you have the appropriate privileges to do so. These notes are visible to all users who have access to the call recording. It is recommended that each user add their initials to the notes to avoid potential confusion.</source>
<seg-source>
<mrk mtype="seg" mid="1">You can add descriptive text notes to a call recording, if you have the appropriate privileges to do so.</mrk>
<mrk mtype="seg" mid="2">These notes are visible to all users who have access to the call recording.</mrk>
<mrk mtype="seg" mid="3">It is recommended that each user add their initials to the notes to avoid potential confusion.</mrk>
</seg-source>
<target state="final">
<mrk mtype="seg" mid="1" /><ph ctype="" id="1"><MadCap:variable name="zoom_userdocs_variables.var_product_name" xmlns:MadCap="http://www.madcapsoftware.com/Schemas/MadCap.xsd" /></ph> позволяет находить телефонные взаимодействия, содержащие или не содержащие определенные фразы.
<mrk mtype="seg" mid="2" />Каждая речевая метка содержит одну или несколько таких фраз.
<mrk mtype="seg" mid="3" />Ядро <ph ctype="" id="3"><MadCap:variable name="zoom_userdocs_variables.var_product_name" xmlns:MadCap="http://www.madcapsoftware.com/Schemas/MadCap.xsd" /></ph> индексирует медиафайлы и помечает места вхождения фразы (добавляет к ним метки).
<mrk mtype="seg" mid="4" />Затем нужные медиафайлы можно искать по связанным с ними меткам.
</target>
</trans-unit>
<trans-unit id="4" phase-name="pretrans" restype="x-p">
<source>To add, delete, or modify text in the description field, click inside the description field.</source>
<seg-source>To add, delete, or modify text in the description field, click inside the description field.</seg-source>
<target state="final">Чтобы добавить, удалить или изменить текст в поле описания, щелкните это поле.</target>
</trans-unit>
</body>
注意第三个节点target
中的标签。标签应该包含现在已经成为兄弟的文本节点(与早期的trans-unit
标签相比,它仍然是正确的),弄乱了结构。mrk
seg-source
因此,我试图识别任何mrk
不包含文本节点的标签,并将以下文本节点移回其中。
这是期望的结果:
<body>
<trans-unit id="1" phase-name="pretrans" restype="x-h3">
<source>Adding, Deleting or Modifying Notes in the Call Description</source>
<seg-source>Adding, Deleting or Modifying Notes in the Call Description</seg-source>
<target state="final">Добавление, удаление и изменение примечаний в описании звонка</target>
</trans-unit>
<trans-unit id="2" phase-name="pretrans" restype="x-p">
<source>Description of Fields on RHS</source>
<seg-source>Description of Fields on RHS</seg-source>
<target state="final">Поле описания в правой части</target>
</trans-unit>
<trans-unit id="3" phase-name="pretrans" restype="x-p">
<source>You can add descriptive text notes to a call recording, if you have the appropriate privileges to do so. These notes are visible to all users who have access to the call recording. It is recommended that each user add their initials to the notes to avoid potential confusion.</source>
<seg-source>
<mrk mtype="seg" mid="1">You can add descriptive text notes to a call recording, if you have the appropriate privileges to do so.</mrk>
<mrk mtype="seg" mid="2">These notes are visible to all users who have access to the call recording.</mrk>
<mrk mtype="seg" mid="3">It is recommended that each user add their initials to the notes to avoid potential confusion.</mrk>
</seg-source>
<target state="final">
<mrk mtype="seg" mid="1"><ph ctype="" id="1"><MadCap:variable name="zoom_userdocs_variables.var_product_name" xmlns:MadCap="http://www.madcapsoftware.com/Schemas/MadCap.xsd" /></ph> позволяет находить телефонные взаимодействия, содержащие или не содержащие определенные фразы.</mrk>
<mrk mtype="seg" mid="2">Каждая речевая метка содержит одну или несколько таких фраз.</mrk>
<mrk mtype="seg" mid="3">Ядро <ph ctype="" id="3"><MadCap:variable name="zoom_userdocs_variables.var_product_name" xmlns:MadCap="http://www.madcapsoftware.com/Schemas/MadCap.xsd" /></ph> индексирует медиафайлы и помечает места вхождения фразы (добавляет к ним метки).</mrk>
<mrk mtype="seg" mid="4">Затем нужные медиафайлы можно искать по связанным с ними меткам.</mrk>
</target>
</trans-unit>
<trans-unit id="4" phase-name="pretrans" restype="x-p">
<source>To add, delete, or modify text in the description field, click inside the description field.</source>
<seg-source>To add, delete, or modify text in the description field, click inside the description field.</seg-source>
<target state="final">Чтобы добавить, удалить или изменить текст в поле описания, щелкните это поле.</target>
</trans-unit>
</body>
我通常会在 Perl 中使用 LibXML 或类似工具执行此操作,但我确信这对于 XSLT 来说是一项简单的任务。我已经搜索了一个类似的解决方案,但找不到任何我可以工作的东西。
还有一点需要注意——尽管这里“打印得很漂亮”,但最终的body
节点定义都在一行上。
谢谢!我期待着学习新的东西!
编辑:更新了上面的源代码以显示<target>
元素中的更多子标签,这些标签必须保留。编辑 2:添加了所需的结果。