我正在尝试使用正则表达式将句子/短语拆分为单词。
var phrase = "This isn't a test.";
var words = Regex.Split(phrase, @"\W+").ToList();
单词包含“This”、“isn”、“t”、“a”、“test”
显然,它正在使用撇号并对其进行拆分。我可以改变这种行为吗?它还需要支持多种语言(西班牙语、法语、俄语、韩语等)的多语言。
我需要将单词传递给拼写检查器。特别是 Nhunspell。
return (from word in words let correct = _engine[langId].Spell(word) where !correct select word).ToList();