3

所以这是我的问题,我试图将文本文件的内容作为字符串获取,然后解析它。我想要的是一个包含每个单词并且只有单词的选项卡(没有空格,没有退格,没有 \n ...)我正在做的是使用一个函数LireFichier将包含文件中文本的字符串发回给我(工作正常因为它显示正确)但是当我尝试解析它失败并开始对我的字符串进行随机连接时,我不明白为什么。这是我正在使用的文本文件的内容:

truc,
ohoh,
toto, tata, titi, tutu,
tete,

这是我的最后一个字符串:

;tete;;titi;;tata;;titi;;tutu;

应该是:

truc;ohoh;toto;tata;titi;tutu;tete;

这是我写的代码(所有使用都可以):

namespace ConsoleApplication1{

class Program
{
    static void Main(string[] args)
    {
        string chemin = "MYPATH";
        string res = LireFichier(chemin);
        Console.WriteLine("End of reading...");
        Console.WriteLine("{0}",res);// The result at this point is good
        Console.WriteLine("...starting parsing");
        res = parseString(res);
        Console.WriteLine("Chaine finale : {0}", res);//The result here is awfull
        Console.ReadLine();//pause
    }

    public static string LireFichier(string FilePath) //Read the file, send back a string with the text
    {
        StreamReader streamReader = new StreamReader(FilePath);
        string text = streamReader.ReadToEnd();
        streamReader.Close();
        return text;
    }

    public static string parseString(string phrase)//is suppsoed to parse the string
    {
        string fin="\n";
        char[] delimiterChars = { ' ','\n',',','\0'};
        string[] words = phrase.Split(delimiterChars);

        TabToString(words);//I check the content of my tab

        for(int i=0;i<words.Length;i++)
        {
            if (words[i] != null)
            {
                fin += words[i] +";";
                Console.WriteLine(fin);//help for debug
            }
        }
        return fin;
    }

    public static void TabToString(string[] montab)//display the content of my tab
    {
        foreach(string s in montab)
        {
            Console.WriteLine(s);
        }
    }
}//Fin de la class Program
}
4

5 回答 5

8

我认为你的主要问题是

  string[] words = phrase.Split(delimiterChars, StringSplitOptions.RemoveEmptyEntries);
于 2012-04-11T08:38:21.490 回答
2

您可以尝试使用字符串拆分选项为您删除空条目:

string[] words = phrase.Split(delimiterChars, StringSplitOptions.RemoveEmptyEntries);

请参阅此处的文档。

于 2012-04-11T08:38:54.580 回答
1

试试这个:

class Program
    {
        static void Main(string[] args)
        {
            var inString = LireFichier(@"C:\temp\file.txt");
            Console.WriteLine(ParseString(inString));
            Console.ReadKey();
        }

        public static string LireFichier(string FilePath) //Read the file, send back a string with the text
        {
            using (StreamReader streamReader = new StreamReader(FilePath))
            {
                string text = streamReader.ReadToEnd();
                streamReader.Close();
                return text;
            }
        }

        public static string ParseString(string input)
        {
            input = input.Replace(Environment.NewLine,string.Empty);
            input = input.Replace(" ", string.Empty);
            string[] chunks = input.Split(',');
            StringBuilder sb = new StringBuilder();
            foreach (string s in chunks)
            {
                sb.Append(s);
                sb.Append(";");
            }
            return sb.ToString(0, sb.ToString().Length - 1);
        }
    }

或这个:

public static string ParseFile(string FilePath)
{
    using (var streamReader = new StreamReader(FilePath))
    {
        return streamReader.ReadToEnd().Replace(Environment.NewLine, string.Empty).Replace(" ", string.Empty).Replace(',', ';');
    }
}
于 2012-04-11T08:42:03.083 回答
1

您的主要问题是您正在拆分\n,但从文件中读取的换行符是\r\n.

您输出的字符串确实包含您的所有项目,但其中\r留下的字符会导致后面的“行”覆盖控制台上的早期“行”。

\r是“返回行首”指令;如果没有\n“移至下一行”指令,第 1 行中的文字将被第 2 行、第 3 行和第 4 行中的内容覆盖。)

除了在 as 上拆分之外\r\n您还需要在将字符串添加到输出之前检查字符串不为空或为空StringSplitOptions.RemoveEmptyEntries(或者,最好像其他人提到的那样使用)。

于 2012-04-11T08:46:09.727 回答
0
string ParseString(string filename) {
    return string.Join(";", System.IO.File.ReadAllLines(filename).Where(x => x.Length > 0).Select(x => string.Join(";", x.Split(",".ToCharArray(), StringSplitOptions.RemoveEmptyEntries).Select(y => y.Trim()))).Select(z => z.Trim())) + ";";
}
于 2012-04-11T09:49:56.833 回答