我必须从报纸文章中提取摘要。摘要是根据给定的关键字和下面提到的规则提取的。
摘要应为 200 个字符。
一旦关键字出现在该句子中,就从文章中的该句子开始打印,最多打印 200 个字符
如果匹配的句子出现在文章的结尾,以至于摘要少于 200 个字符,则从匹配的句子向后移动到前面的句子,直到最终打印出包含匹配句子的 200 个字符。
到目前为止我所做的是......
var regex = new Regex(keyword+@"(.{0,200})");
foreach (Match match in regex.Matches(input))
{
var result = match.Groups[1].Value;
Console.WriteLine(result);
// work with the result
}
上面的代码成功到达第一个匹配的句子,但在关键字最多 200 个字符之后开始打印,而不是匹配句子的开头。
如果在打印 200 个字符之前到达文章结尾,也没有回溯。
请指导我应该如何进行。即使有人不知道完整的解决方案,请在问题的子部分帮助我。