几天前,我问了一个关于在 2 个文本文件中标记差异的问题,并很快得到了回答。
现在我有一个相当相似的问题,但有点复杂。我有 2 对具有以下特征的文件: pair1: (File1.txt , File2.txt) pair2: (File3.txt , File4.txt)
这些对中的每个文件之间存在逐行对应关系。说 File1.txt 和 File3.txt 是一些英文单词,File2.txt 和 File4.txt 分别是它们的阿拉伯语和法语翻译。此外,File1.txt 和 File3.txt 非常相似(在某些情况下相同)。
File1.txt File2.txt
EnWord1 ArTrans1
EnWord2 ArTrans2
EnWord3 ArTrans3
Enword4 ArTrans4
File3.txt File4.txt
EnWord1 FrTrans1
EnWord3 FrTrans3
Enword4 FrTrans4
Enword5 FrTrans5
现在我要做的是比较这些对的英文面,找到两个文件中出现的共同词(EnWord1、EnWord3 和 EnWord4)并过滤掉它们对应的翻译。简而言之,我可以说使用两个双语英语-阿拉伯语和英语法语词典,我正在尝试构建一个 3 语种英语-阿拉伯语-法语词典。怎么可能?
我必须补充一点,因为有很多这样的对(字典存储在不同的文件中,每个文件都包含一部分单词,并且由于某些原因无法合并文件然后处理它们)代码的速度非常重要,我正在寻找一种快速的方法来做到这一点。
最后,请给我一些要点(甚至可能是完整的代码)在 Perl 中执行此操作。
最好的问候,哈基姆