我从事视频游戏本地化工作,我们的 CAT 工具使用正则表达式来检测标签。通常,它们被 [] 包围,因此我们使用 [(.*?)] 来识别它们。然后 CAT 工具以标签格式导入此标签,这意味着翻译人员无法编辑/破坏标签或在没有警告的情况下将其删除。
但是,我们有一个项目,其中包含一个 Gender 标签,其中包含我们需要翻译的属性。标签如下:
[Gender: "male", "female"]
这个想法是是否有一个标签可以将整个片段识别为一个实体,但将男性和女性排除在外。我们使用了这三个(在逗号和方括号之间添加了一些空格以使 \ 可见,如果造成混淆,请见谅):
\ [Gender\: \"
\"\ , \"
\"\ ]
但是,它也可能会在以下句子中产生文本问题:他们说“不,我们不”、“我们想要更多”等。
将", "
被不必要地检测为标签。
有没有办法拥有一个独特的正则表达式来避免这种情况?如果是这样,如果有更多可翻译的元素或者有限制,是否有可能拥有一个?I.e.: [Gender: "male", "female", "neutral"]
非常感谢您!
更新:作为参考,我附上了正则表达式设置。在底部,您可以看到程序如何使用它们来创建标签。红色元素被转换为对象而不是文本。这样翻译者就不会破坏标签也不会忘记添加它。 在此处输入图像描述