1

您如何处理双语/平行文本的两侧?

我知道如何在文本上运行 diff 和 ediff 以发现小的差异,但是双语文本将有两个完全不同的方面(除了段落、章节数和其他结构元素,如注释)。行尾和段尾对于标记两侧的单位当然很有用。

是否可以并排打开两个缓冲区,并告诉什么匹配什么?

4

1 回答 1

2

这是一个难题,但我翻出了我不久前读过的一篇相关的旧博客文章(甚至提到了用于预处理的 emacs):

https://languagefixation.wordpress.com/2011/02/09/how-to-create-parallel-texts-for-language-learning-part-1/

特别是查看第 2 部分

除此之外,我的建议是双重的:

1) 一次只处理小部分(一章或更少),而不是整本书

2) 利用可用的对齐工具来生成 emacs 用来“美化”缓冲区的元数据

由于没有现有的解决方案(我知道或可以找到),您将不得不使用 elisp 并创建一个主要或次要模式来为匹配段着色和/或导航段。

快速破解

但是,我一起破解了一些 elisp,它采用预处理文本并使用 emacs 的“段落”和“句子”概念对缓冲区进行着色;这有点冗长,所以我把它放在一个要点中:

https://gist.github.com/terranpro/3175bb9f3ed00b3a145c

简单的例子 这很丑陋,但应该给你一个开始;只需在每个文本缓冲区中运行一次。但请注意,您需要根据 emacs 的段落和句子(句号后两个空格!!)准备好文本。希望它能给你一个体面的起点。

于 2013-07-18T10:31:35.203 回答