4

我在一个文件中有几行整数,例如

100 20 300 20 9 45 -1
101 80 80 2 80 2 50 3 70 -1

我想读取前 2 个字符并将它们存储在整数变量中,然后将其余字符存储在一个字符串中,以便稍后进行迭代。

do {
    fscanf(file, "%d %d", &var1,&var2);
    }while(!feof(file));

现在我想扫描该行的其余部分,移动到下一行并重复。但我不确定如何将该行的其余部分扫描为 var3 字符串

..有任何想法吗?

4

2 回答 2

8

这是你要做的第一件事。scanf("%s")除非您完全控制输入数据,否则请放弃任何使用的想法。否则,你会为缓冲区溢出敞开心扉。

这个答案显示了一种fgets用于用户输入的安全方法,提供缓冲区溢出检测/避免和行清除,可以很容易地适应任何输入流。

一旦将行(和行)作为字符串,并且因此知道它可能的最大大小,您可以简单地使用:

char strBuff[1000]. str1[1000]; // Ensure both big enough.
:
// Use /getLine/fgets to get the line into strBuff.
:
int numScanned = sscanf (strBuff, "%d %d %[^\n]", &int1, &int2, str1);

格式说明符的%[^\n]作用是将任意数量的非换行符扫描成一个字符串:[]表示一个字符类,^意思是“匹配除了后面的字符之外的所有字符,用于(非)匹配的字符是换行符\n

标准引文在此答案(a)的底部。


例如,使用该功能:

#include <stdio.h>
#include <string.h>

#define OK       0
#define NO_INPUT 1
#define TOO_LONG 2
static int getLine (char *prmpt, char *buff, size_t sz) {
    int ch, extra;

    // Get line with buffer overrun protection.
    if (prmpt != NULL) {
        printf ("%s", prmpt);
        fflush (stdout);
    }
    if (fgets (buff, sz, stdin) == NULL)
        return NO_INPUT;

    // If it was too long, there'll be no newline. In that case, we flush
    // to end of line so that excess doesn't affect the next call.
    if (buff[strlen(buff)-1] != '\n') {
        extra = 0;
        while (((ch = getchar()) != '\n') && (ch != EOF))
            extra = 1;
        return (extra == 1) ? TOO_LONG : OK;
    }

    // Otherwise remove newline and give string back to caller.
    buff[strlen(buff)-1] = '\0';
    return OK;
}

使用以下程序:

int main (void) {
    int rc, numScanned, int1, int2;;
    char strBuff[100], str1[100];

    rc = getLine ("Yes> ", strBuff, sizeof(strBuff));
    if (rc == NO_INPUT) {
        // Extra NL since my system doesn't output that on EOF.
        printf ("\nNo input\n");
        return 1;
    }

    if (rc == TOO_LONG) {
        printf ("Input too long [%s]\n", strBuff);
        return 1;
    }

    printf ("OK [%s]\n", strBuff);

    numScanned = sscanf (strBuff, "%d %d %[^\n]", &int1, &int2, str1);
    printf ("numScanned = %d\n", numScanned);
    printf ("int1       = %d\n", int1);
    printf ("int2       = %d\n", int2);
    printf ("str1       = [%s]\n", str1);

    return 0;
}

给出以下输出:

Yes> 100 20 300 20 9 45 -1 blah blah blah
OK [100 20 300 20 9 45 -1 blah blah blah]
numScanned = 3
int1       = 100
int2       = 20
str1       = [300 20 9 45 -1 blah blah blah]

(a)7.20.6.2 The fscanf function的部分C11(尽管从 中没有改变C99)说明了有关[格式说明符的内容,稍作解释以删除不相关的多字节内容:

[格式说明符匹配来自一组预期字符(扫描集)的非空字符序列。

相应的参数应该是一个指向字符数组的初始元素的指针,该元素数组的大小足以接受序列和一个终止的空字符,它将自动添加。

转换说明符包括格式字符串中的所有后续字符,直到并包括匹配的右括号 ( ])。

括号之间的字符(扫描列表)组成扫描集,除非左括号之后的字符是一个抑扬符 (^),在这种情况下,扫描集包含所有未出现在抑扬符和右括号之间的扫描列表中的字符。如果转换说明符以[]or开头[^],则右括号字符在扫描列表中,并且下一个右括号字符是结束说明的匹配右括号;否则后面的第一个右括号字符是结束规范的字符。

于 2012-10-23T01:21:21.087 回答
4

scanf不,只要您知道缓冲区的大小,就可以使用。您可以避免缓冲区溢出测试它何时发生。恢复逻辑把事情搞砸了,但它仍然是可能的。我建议使缓冲区足够大,以至于溢出确实是一种放弃和死亡的错误。

首先假设一个 256-bye 缓冲区,以及一些需要声明的其他变量。您可以存储的最长字符串为 255 个字节。您可能想要扫描内部空白,但不希望\n末尾的换行符成为字符串的一部分。(在这种情况下,这是 的主要问题fgets。)魔术序列是:

char var[256], endchar = '\n';
int n;

n = scanf("%255[^\n]%c", var, &endchar);
if ((n < 1) || (endchar!='\n') || ferror(stdin))
{
    if (n==2) { /*it's a buffer overflow*/ }
    else if (n==0 && !ferror(stdin)) { /*must be EOF on 1st byte*/ }
    else { /*an I/O error occurred*/ }
} else { /* OK */ }

这几乎是防弹的,所有的循环都发生在库中。scanf格式分解为:

  1. %255[^\n]: 最多 255 个字符串,除了换行符。
  2. %c: 存储下一个字符的单个字符,如果有的话。

返回值是成功存储的字段数。那,结束值endcharferror()结果告诉你在几个 if 语句中你需要知道的一切。单if检测正常情况。

这允许EOF在最后一行没有换行符。在这种情况下,feof(stdin)外部循环将检测到。

PS:反对scanf %s(和相关%[])的论点是有根据的,但是如果您可以确保该值与缓冲区大小一致,那么它们是完全安全%nnns的。遗憾的是,无法为格式提供计算缓冲区大小。我所知道的最佳选择是使用.%nnn[]"nnn"scanf()sprintf()

于 2012-10-23T02:08:01.670 回答