0

嗨,这可能看起来有点菜鸟,但我们开始吧。我正在开发一个程序,该程序可以从互联网上下载某个游戏的排行榜并将其转换为适当的格式以供使用(详细排名等)。

这些文件包含按等级排序的名称,但在每个名称之间有 7 个随机控制代码(显然不可打印)。txt 文件如下所示:

..C...hName1..)...&Name2...)Name3..é...þName4..Ü...†Name5..'...QName6..~... bName7..H...NName8..|..Name9..v...HName10。

通过 hexEditor 检查并看到每个名称后的第一个控制代码始终是空字符(0x00)。所以,我所做的就是阅读所有内容,然后找出每个字符。当找到一个 0x00 字符时,跳过7 个字符并继续计算。因此,您最终得到了列表,对吗?

起初我遇到的问题是,在那些随机控制代码上,有时你会发现像“软 EOF”(0x1A),程序会在那里停止读取。所以我终于想出了以二进制模式打开它。它起作用了,然后一切都会被计算出来……或者这就是我的想法。

但是我遇到了另一个文件仍然不起作用,最后发现有一个EOF字符!( 0x0A ) 这没有意义,因为我以二进制模式打开它。但是,在读取该字符之后,C++ 将其解释为一个新文件,因此会跳过 7 个字符,因此该字符后面的名称将始终显示为 cut。

这是我当前的代码:

#include <cstdlib>
#include <iostream>
#include <fstream>
using namespace std;


int main () {
  string scores;
  system("wget http://certainwebsite/001.txt"); //download file
  ifstream highin ("001.txt", ios::binary);
  ofstream highout ("board.txt", ios::binary);
  if (highin.is_open())
  {
    while ( highin.good() )
    {
          getline (highin, scores);
          for (int i=0;i<scores.length(); i++)
          {
              if (scores[i]==0x00){
                 i=i+7; //skip 7 characters if 'null' is found
                 cout << endl;
                 highout << endl;
                 }
              cout << scores[i];
              highout << scores[i]; //cout names and save them in output file
          }
    }
    highin.close();
  }
  else cout << "Unable to open file";
  system("pause>nul");
}

如果已经处于二进制模式不起作用,则不确定如何忽略该字符。很抱歉这个问题很长,但我想详细而具体。在这种情况下,EOF 字符位于 Name3 之前,因此输出如下所示:http: //i.imgur.com/yu1NjoZ.png

4

3 回答 3

2

默认情况下getline()读取到行尾并丢弃换行符。但是,可以自定义分隔符(通过提供第三个参数)。如果您希望阅读到空字符(而不是直到行尾),您可以尝试使用getline (highin, scores, '\0');(并调整跳过字符的逻辑)。

于 2013-05-26T18:23:47.447 回答
1

我很高兴你明白了,getline() 是罪魁祸首并不让我感到惊讶。当我尝试读取 CSV 文件时,我在处理换行符时遇到了类似的问题。C++ 中有几个不同的 getline() 函数,具体取决于您调用函数的方式,并且每个函数似乎都以不同的方式处理换行符。

作为旁注,在您的 for 循环中,我建议您不要在测试中执行方法调用。这给循环增加了不必要的开销。最好调用一次该方法并将该值放入变量中,然后进入循环并针对长度变量测试 i。除非您期望长度发生变化,否则每次迭代调用 length() 方法都是对系统资源的浪费。

于 2013-05-27T02:57:54.577 回答
0

谢谢大家,它起作用了,确实是 getline() 给我带来了问题。由于“while”循环,每次它找到一个换行符时,它都会重新启动该过程,因此跳过这 7 个字符。

于 2013-05-27T02:04:46.653 回答