regex - 标签的正则表达式，但不包括属性

Question

我从事视频游戏本地化工作，我们的 CAT 工具使用正则表达式来检测标签。通常，它们被 [] 包围，因此我们使用 [(.*?)] 来识别它们。然后 CAT 工具以标签格式导入此标签，这意味着翻译人员无法编辑/破坏标签或在没有警告的情况下将其删除。

但是，我们有一个项目，其中包含一个 Gender 标签，其中包含我们需要翻译的属性。标签如下：

[Gender: "male", "female"]

这个想法是是否有一个标签可以将整个片段识别为一个实体，但将男性和女性排除在外。我们使用了这三个（在逗号和方括号之间添加了一些空格以使 \ 可见，如果造成混淆，请见谅）：

\ [Gender\: \"

\"\ , \"

\"\ ]

但是，它也可能会在以下句子中产生文本问题：他们说“不，我们不”、“我们想要更多”等。

将", "被不必要地检测为标签。

有没有办法拥有一个独特的正则表达式来避免这种情况？如果是这样，如果有更多可翻译的元素或者有限制，是否有可能拥有一个？I.e.: [Gender: "male", "female", "neutral"]

非常感谢您！

更新：作为参考，我附上了正则表达式设置。在底部，您可以看到程序如何使用它们来创建标签。红色元素被转换为对象而不是文本。这样翻译者就不会破坏标签也不会忘记添加它。在此处输入图像描述

score 0 · Accepted Answer

好的，根据您的图片，我认为更好的方法是制作多个正则表达式。因为看起来您可以应用多个规则

一个匹配普通标签（注意它如何只匹配这些）

\[([^:\"])+\]

对于具有多个可翻译元素的片段，我们需要一些东西。

首先匹配那些元素的开始

\[([^:\n]+: ?\")

然后一个标记逗号分隔符

(?<=[^\]])(\", ?\")

最后一个匹配段的结尾

(?<=[^\]]*?)\"\]

您可能需要根据程序使用的正则表达式类型更改语法。最后两个正则表达式使用正向回溯，其语法可能略有不同。或者甚至不支持。

希望能帮助到你

编辑：如果将规则应用在athother之上，这可能不起作用，因为我假设输入文本每次输入规则时都是相同的。但也许这可以在过滤器下拉列表中配置？

1 回答 1