我有一个很长的文本文件...我阅读了文本文件并将内容存储在一个字符串中...现在我希望拆分此文本。下面是一张显示我想要的图片。在图像中“ This is common text ”表示该字符串在每个段落中都是通用的。
绿色方块表示我想要字符串数组中的那部分。但是怎么做...我已经为此尝试过正则表达式...但是不起作用...请帮助
我不确定你想分割什么,但你可以使用
string[] stringArray = Regex.Split(yourString, regex);
如果您想要一个更具体的示例,您将不得不(正如其他人提到的)向我们提供有关文本外观的更多信息,而不仅仅是“普通文本”。
尝试RegEx.Split()
使用这种模式:
(.*This is common text.*)
好吧,放弃is 总是priority to RegEx
会string functions
导致性能开销。
如果你使用它会很棒:(未经测试,但它会给你一个想法)
string[] lines = IO.File.ReadAllLines("FilePath")
List<string> lst = new List<string>();
List<string> lstgroup = new List<string>();
int i=0;
foreach(string line in lines)
{
if(line.Tolower().contains("this is common text"))
{
if(i > 0)
{
lst.AddRange(lstgroup.ToArray());
// Print elements here
lstgroup.Clear();
}
else { i++; }
continue;
}
else
{
lstgroup.Add(line)
}
}
i = 0;
// Print elements here too