我在网上搜索了计算待翻译文档中重复次数的标准公式。我还没有找到它。对于那些不知道翻译中的重复是什么意思的人来说,这很好地描述了它。
我首先尝试过这样的事情
using System;
using System.Collection.Generic;
using System.Text.RegularExpressions;
using System.Linq;
<snip>
Dictionary<string, int> _dict = new Dictionary<string, int>();
int CalculateRepetitions(string plainTextDoc) {
foreach (string item in Regex.Split(plainTextDoc, "\\P{L}+"))
if (_dict.ContainsKey(item))
_dict[item]++;
else
_dict.Add(item, 0);
return _dict.Where((key, value) => value > 0).Count();
}
但这与同一文档的 Trados 样本编号并不接近,而且无论如何都是错误的重复定义。有没有人有一个计算翻译重复的好例子?我不期待只有 C# 的答案,我也很擅长 java 和 c++ 的答案。