我有一个充满泰米尔语单词和搜索字符串的网格。我需要通过网格记录实现全词搜索。我正在为这种方法使用 .NET Regex 类。听起来很简单,我以前做的是:
string pattern = @"\b" + searchText + @"\b"
.
它在拉丁语中按预期工作,但对于泰米尔语,此表达式返回奇怪的结果。我已经阅读了正则表达式中的 Unicode 字符,但这对我来说似乎不太有帮助。我可能需要确定单词边界在哪里找到以及为什么。
例如:对于"\bஅம்மா\b"
模式 Regex 在 அம்மாவிடம் 和 அம்மாக்கள் 记录中找到匹配项,但在原始 அம்மா 记录中没有找到匹配项。