0

我在网上搜索了计算待翻译文档中重复次数的标准公式。我还没有找到它。对于那些不知道翻译中的重复是什么意思的人来说,很好地描述了它。

我首先尝试过这样的事情

using System;
using System.Collection.Generic;
using System.Text.RegularExpressions;
using System.Linq;
<snip>
Dictionary<string, int> _dict = new Dictionary<string, int>();
int CalculateRepetitions(string plainTextDoc) {
    foreach (string item in Regex.Split(plainTextDoc, "\\P{L}+"))
        if (_dict.ContainsKey(item))
            _dict[item]++;
        else
            _dict.Add(item, 0);
    return _dict.Where((key, value) => value > 0).Count();
}

但这与同一文档的 Trados 样本编号并不接近,而且无论如何都是错误的重复定义。有没有人有一个计算翻译重复的好例子?我不期待只有 C# 的答案,我也很擅长 java 和 c++ 的答案。

4

1 回答 1

0

GMX/V标准可能是您的答案,而且似乎有一个C# 实现

于 2012-11-06T09:03:20.093 回答