1

我想读取带有“#”附加到单词的文件我想从单词
输入文件中删除它

a, 00001740, 0.125, 0,     able#1
a, 00001740, 0.125, 0,     play#2
a, 00002098, 0,     0.75,  unable#1

我想要以下没有#
输出的格式应该是这个

a, 00001740, 0.125,  0,      able
a, 00001740, 0 .125, 0,      play
a, 00002098, 0,      0.75,   unable

我写下面的代码

TextWriter tw = new StreamWriter("D:\\output.txt");
private void button1_Click(object sender, EventArgs e)
        {
            if (textBox1.Text != "")
            {

                StreamReader reader = new StreamReader("D:\\input.txt"); 
                string line;
                while ((line = reader.ReadLine()) != null)
                {
                    Regex expression = new Regex(@"\b\w+(?=#\d*\b)");
                    var results = expression.Matches(reader.ToString())
                    foreach (Match match in results)
                    {


                        tw.Write(match);

                    }
                    tw.Write("\r\n");
                }
                tw.Close();
                reader.Close();
            }
            textBox1.Text = "";                    
        }
    }
4

5 回答 5

1

利用Regex.Replace()

string result = Regex.Replace(input, "#.*", "");
于 2013-03-02T12:29:19.167 回答
0

您的整个代码可以替换为 3 行:

string txt = File.ReadAllText("D:\\input.txt");
txt = Regex.Replace(txt, "#.*?(\r\n|\n|$)", "$1");
File.WriteAllText("D:\\output.txt", txt);
于 2013-03-02T12:44:14.777 回答
0

您可能希望将其写入其他文件,因为您在读取原始文件的内容时正在重写文件,如果您不想读取和缓存文件的全部内容。

另外,考虑这个例子:

int index = line.IndexOf("#");
if (index != -1)
{
    line = line.Substring(0, index - 1);
}

在这里,您不必处理正则表达式,因此运行速度会更快。

于 2013-03-02T12:37:29.997 回答
0

正则表达式替换可能是这里最好的选择。

 File.WriteAllLines("c:\\output.txt", File.ReadAllLines("c:\\input.txt").Select(line => Regex.Replace(line, "#.*","")));

或者可能TakeWhile

File.WriteAllLines("c:\\test24.txt", File.ReadAllLines("c:\\test.txt").Select(line => new string(line.TakeWhile(c => c != '#').ToArray())));
于 2013-03-02T12:48:47.237 回答
0

根据我的评论试试这个:

        string s = "a, 00001740, 0.125, 0,     able#1";
        string m = Regex.Replace(s, @"#\d$", ""); 
        //for more than one digit  @"#\d+$"
        Console.WriteLine(m);
        Console.ReadLine();
于 2013-03-02T12:50:01.947 回答