2

我编写了一个程序来计算文本文件中字母数字字符的数量。但是,它返回的数字总是大于在线字符计数器返回的数字。

例如,程序将计算此文本中字母数字字符的数量:

如果这些人有奇怪的时尚,并期望在最不寻常的事情上服从,他们至少准备好为自己的古怪付出代价

是162。再次运行程序,它会说文本中有164个字符。再次运行它,它会说有 156 个字符。使用这个在线字符计数器,似乎字符数应该低于 144(在线字符计数器也包括空格)。

这是代码:

#include <iostream>
#include <fstream>
#include <cctype>
using namespace std;

int main() {
    char line[100];
    int charcount = 0;
    ifstream file("pg1661sample.txt");
    while (!file.eof()) {
        file.getline(line, 99);
        for (int i = 0; i < 100; i++) {
            if (isalnum(line[i])) {
                charcount++;
            }
        }
    }

    cout << endl << "Alphanumeric character count: " << charcount;
    cin.get();
    return 0;
}

我究竟做错了什么?

4

3 回答 3

5

尝试:

#include <iterator>
#include <algorithm>
#include <iostream>
#include <cctype>
bool isAlphaNum(unsigned char x){return std::isalnum(x);}
int main()
{
    std::cout << "Alphanumeric character count: " <<
    std::count_if(std::istream_iterator<char>(std::cin),
                  std::istream_iterator<char>(),
                  isAlphaNum
                 ) ;
}

您的代码存在问题:

在您阅读文件末尾之前,EOF 不正确:

 // this is true even if there is nothing left to read.
 // If fails the first time you read after there is nothing left.
 while (!file.eof()) {

 // thus this line may fail
     file.getline(line, 99);

最好总是这样做:

 while(file.getline(line, 99))

只有当 getline 实际工作时才进入循环。

您还使用了错误版本的 getline(因为行可能大于 100 个字符)。
尝试使用与 std::string 一起使用的版本,以便它自动扩展。

std::string  line;
while(std::getline(file, line))
{
     // stuff
}

接下来,您假设该行正好是 100 个字符。
如果该行只有 2 个字符长,会发生什么?

for (int i = 0; i < 100; i++)

基本上,您将扫描数据,它将计算上一行遗留下来的字母(如果前一行比当前行长)或完全随机的垃圾。如果您仍在使用file.getline(),那么您可以使用 检索一行中的字符数file.gcount()。如果您使用 std::getline() 则变量line将是读取的行的确切大小 ( line.size())。

于 2012-08-20T22:45:11.640 回答
1
while (!file.eof()) {

不要这样做。eof() 直到尝试输入失败后才会返回 true ,因此像这样的循环会运行额外的时间。相反,请执行以下操作:

while (!file.getline(line, 99)) {

当输入结束时循环将终止。

另一个问题是在计算字符的循环中。问问自己:每次通过输入循环时有多少字符被读入缓冲区?那么,为什么计数循环会查看 100 个字符呢?

于 2012-08-20T22:35:19.970 回答
0

您假设它恰好getline()填充了 100 个字符。line检查由 读取的字符串的长度getline(),例如使用strlen()

for (int i = 0; i < strlen(line); i++) {
    if (isalnum(line[i])) {
        charcount++;
    }
}

编辑:另外,请确保您注意其他答案的建议,将getline()' 的返回值用于循环条件而不是调用eof().

于 2012-08-20T22:33:01.327 回答