您如何处理双语/平行文本的两侧?
我知道如何在文本上运行 diff 和 ediff 以发现小的差异,但是双语文本将有两个完全不同的方面(除了段落、章节数和其他结构元素,如注释)。行尾和段尾对于标记两侧的单位当然很有用。
是否可以并排打开两个缓冲区,并告诉什么匹配什么?
您如何处理双语/平行文本的两侧?
我知道如何在文本上运行 diff 和 ediff 以发现小的差异,但是双语文本将有两个完全不同的方面(除了段落、章节数和其他结构元素,如注释)。行尾和段尾对于标记两侧的单位当然很有用。
是否可以并排打开两个缓冲区,并告诉什么匹配什么?
这是一个难题,但我翻出了我不久前读过的一篇相关的旧博客文章(甚至提到了用于预处理的 emacs):
特别是查看第 2 部分
除此之外,我的建议是双重的:
1) 一次只处理小部分(一章或更少),而不是整本书
2) 利用可用的对齐工具来生成 emacs 用来“美化”缓冲区的元数据
由于没有现有的解决方案(我知道或可以找到),您将不得不使用 elisp 并创建一个主要或次要模式来为匹配段着色和/或导航段。
快速破解
但是,我一起破解了一些 elisp,它采用预处理文本并使用 emacs 的“段落”和“句子”概念对缓冲区进行着色;这有点冗长,所以我把它放在一个要点中:
https://gist.github.com/terranpro/3175bb9f3ed00b3a145c
这很丑陋,但应该给你一个开始;只需在每个文本缓冲区中运行一次。但请注意,您需要根据 emacs 的段落和句子(句号后两个空格!!)准备好文本。希望它能给你一个体面的起点。