1

我有一个文件,我已经修剪过只保留其中的一些数据。该文件是我想添加到第二个文件末尾的文件。这是第一个文件的样子:

147221
147486
147514-1
147502
147503
...

我想将它连接到一个看起来像这样的文件的末尾:

       some text    ... more text

text    text: Description                 

Ln      PPN PD  Qty Units   Comment MNAME   MfMCODE
                                 some comment       
1   EC5547  PCB:  SB5500 LCD DISPLAY  CTRL +RHS 1.00    EA  REV 07 OR LATER     
2   EC0303  FERRITE BEAD: 200MA 1000Z0.8 SM0603 +RHS    2.00    EA  FB2 FB4 MURATA  BLM18RK102SN1
3   EC0304  FERRITE BEAD: 2000MA 220Z0.05 SM0805 +RHS   2.00    EA  FB1 FB5 MURATA  BLM21PG221SN1
4   EC7727  IC: LTC2851 RS422 XCVR SO8 +RHS 1.00    EA  U10 LINEAR TECHNOLOGIES LTC2851CS8#PBF
                    LINEAR TECHNOLOGIES LTC2851IS8#PBF
                    MAXIM   MAX3077EASA+
                    MAXIM   MAX3077EESA+
                DNP  C20 C24 C25 C27 C44 C60 C62 J1 J5 J6 J7 J8 J11 R2 R20      
                R29 R33 R53 R54 R89 R91 R94 R96 R107 R108 R109 C63 R61      
                J12 J13 U7 TP1-20 TP22-28 TP34-36 TP38-39 TP41 TP43-54      
                TP56-96     

5   EC5071  CONN: HEADER RA 0.1x10 0.025 SQ +RHS    1.00    EQ  J2  SAMTEC  TSW-110-08-S-S-RA
...

通过匹配来查看第二个文件行是否以 1、2、3、4、5 等开头,然后以相同的顺序添加第一个文件中的行。

我的意思是它看起来像这样:

       some text    ... more text

text    text: Description                 

Ln      PPN PD  Qty Units   Comment MNAME   MfMCODE
                                 some comment       
1   EC5547  PCB:  SB5500 LCD DISPLAY  CTRL +RHS 1.00    EA  REV 07 OR LATER  147221

2   EC0303  FERRITE BEAD: 200MA 1000Z0.8 SM0603 +RHS    2.00    EA  FB2 FB4 MURATA  BLM18RK102SN1    147486
3   EC0304  FERRITE BEAD: 2000MA 220Z0.05 SM0805 +RHS   2.00    EA  FB1 FB5 MURATA  BLM21PG221SN1    147514-1
4   EC7727  IC: LTC2851 RS422 XCVR SO8 +RHS 1.00    EA  U10 LINEAR TECHNOLOGIES LTC2851CS8#PBF       147502
                    LINEAR TECHNOLOGIES LTC2851IS8#PBF
                    MAXIM   MAX3077EASA+
                    MAXIM   MAX3077EESA+
                DNP  C20 C24 C25 C27 C44 C60 C62 J1 J5 J6 J7 J8 J11 R2 R20      
                R29 R33 R53 R54 R89 R91 R94 R96 R107 R108 R109 C63 R61      
                J12 J13 U7 TP1-20 TP22-28 TP34-36 TP38-39 TP41 TP43-54      
                TP56-96     

5   EC5071  CONN: HEADER RA 0.1x10 0.025 SQ +RHS    1.00    EQ  J2  SAMTEC  TSW-110-08-S-S-RA        147503
.... 

想法

  • 现在我认为解决这个问题的最好方法是修剪原始文件(我已经完成了),然后搜索第二个文件以查找以数字开头的行。(我想用正则表达式来做到这一点:...@"^[\d]+\s+"...)。但是,使用该正则表达式,我只会抓住线上的数字而不是整条线?但是,如果我能够抓取整行(我不知道如何),如果找到该行,我会将其放在一个字符串中,然后将前一个文件的第一行添加到该字符串的末尾分隔符“\t”。

差不多:

  • 将第一个文件修剪为连接到第二个文件末尾所需的必要数字(完成)
  • 抓取第二个文件中的每一行(一个接一个?)
    • 检查该行是否以数字开头(使用正则表达式?)
      • 如果是这样,请将第 1 个文件中的第 1 行添加到第 2 个文件中匹配的末尾(对所有匹配执行此操作。第 2 行与第 2 匹配,第 3 行与第 3 匹配等)并将其存储为新字符串。(问题是必须有一大堆字符串......而且我不熟悉列表......)
  • 现在返回第二个文件的每一行,并将新字符串(以第一个文件结尾)与第二个文件中的每一行进行比较。如果匹配,则将该行替换为字符串中的行。
  • 将其输出到富文本框/.txt 文件。

问题

  • 如何在第二个文件中找到以 1、2、3、4、5 等开头的行,然后逐行抓取第一个文件并将第一行添加到第一行。在这种情况下,将 147221 添加到以 1 开头的整行的末尾(147486 到以 2 开头的行的末尾,等等)?
  • 有谁知道更简单的方法来做到这一点?
4

4 回答 4

1

这将从两个输入文件中读取并写入第三个。关于正则表达式模式,如果一行以任何正整数(不包括零)开头紧跟一个空格字符(例如,像“10 some non-numeric text”这样的行将是匹配的),这将起作用。

using (StreamReader sr1 = new StreamReader(@"C:\Temp\Content.txt"))
using (StreamReader sr2 = new StreamReader(@"C:\Temp\Numbers.txt"))
using (StreamWriter sw = new StreamWriter(@"C:\Temp\Combined.txt"))
{
    string curLine;
    while ((curLine = sr1.ReadLine()) != null)
    {
        if (Regex.IsMatch(curLine, "^[1-9][0-9]*\s"))
        {
            sw.WriteLine(curLine + "    " + sr2.ReadLine());
        }
        else
        {
            sw.WriteLine(curLine);
        }
    }
}
于 2011-07-09T15:11:49.370 回答
1

假设您感兴趣的行总是以一些没有前导空格的数字开头,我只会使用正则表达式来验证该行是否是您要查找的行(或者甚至只是简单地检查第一个该行的字符是使用Char.IsDigit()) 的数字,然后在找到它后进行任何处理。

using (var dataReader = File.OpenText(@"path\to\data\file"))
using (var labelReader = File.OpenText(@"path\to\label\file"))
using (var writer = File.CreateText(@"path\to\output\file"))
{
    string line;
    while ((line = dataReader.ReadLine()) != null)
    {
        if (Regex.IsMatch(line, @"^\d+"))
        {   // found the line (append label)
            writer.WriteLine(line + " " + labelReader.ReadLine());
        }
        else
        {   // not the line (pass through)
            writer.WriteLine(line);
        }
    }
}
于 2011-07-09T15:56:41.190 回答
0

不确定正则表达式,但您可以使用 sting 函数通过 if-else 语句来执行此操作(可能不是一个可靠的语句,但可以)

string str = "1   EC5547  PCB:  SB5500 LCD DISPLAY  CTRL +RHS 1.00    EA  REV 07 OR LATER";
        string str1 = "147221";

        if (str.StartsWith("1"))
        {
            str += str1; 
        }
于 2011-07-08T22:01:46.773 回答
0

输出很简单,我们可以稍后再考虑。作为一般方法,我会将您的第一个文件编号加载到一个数组中(如果需要,您可以执行某种列表或向量,但我认为没有必要)。在解析从 0 开始的第二个文件时有一个计数器。当您找到要输出到的行时,然后使用计数器作为字符串数组的索引以按顺序获取下一个字符串。写出数字后,增加你的计数器。可以在迭代时将其写回文件。像这样的东西(未经测试!!!这只是为了展示这个想法。)应该可以工作:

StringBuilder newFile = new StringBuilder();
string[] file = File.ReadAllLines(@"file2path");

foreach (string line in file)
{
    if (!regex evaluation here!)
    {
        //append your number and increment counter here

        string temp = line.Replace(oldString, appendedString);

        newFile.Append(temp + "\r\n");

        continue;

    }

    newFile.Append(line + "\r\n");

}

File.WriteAllText(@""file2path", newFile.ToString());
于 2011-07-08T22:08:18.313 回答