0

C 代码非常简单:从名为file_bib1i 的文件中获取每一行文本以供进一步分析(尚未实现)。这是代码:

int main ()
{
FILE * fp;
char *a;
int check;
int end = 0;
long int size;
long int start = 0;
fp = fopen("file_bib1", "r");

while ( end != 1 )
{
    size = 0;

    if (ftell(fp) != 0)
        start = ftell(fp) + 1;

    fseek(fp, start, SEEK_SET); 
    while (getc(fp) != '\n')
        size = size + 1;

    fseek(fp, start, SEEK_SET);
    a = (char*) malloc(size * sizeof(char));

    check = fscanf(fp, "%[^\n]", a);
    if( check == 0)
    {
        fscanf(fp, "%[^\EOF]", a);
        end = 1;
    }
    printf("%s\n", a);
    free(a);
}

fclose(fp);

return 0;
}

相反,这是 'file_bib1' 的内容:

autore: Di Ciccio      , Antonio; titolo: Manuale di architettura pisana; editore: Palestro; anno: 1990; prestito: t Fri Feb 10 00:00:00 CET 2012; volume: 1345; scaffale: A.west.2;      
autore : Di Ciccio   , Antonio; titolo: Manuale di architettura pisana; editore: Palestro; anno: 1990; luogo_pubblicazione: Milano; prestito: 10-02-2012; collocazione: B.23.4;descrizione_fisica: 123 p., ill,  23 cm;
autore: Melis, Antonio Pietro Angelo; autore: Gatto Magnolfi, Gianni;  titolo:Manuale di architettura fiorentina; editore: EQR; anno: 1910; nota:  Copia del Vescovo; collocazione: Z.12.56; luogo_pubblicazione: Firenze; descrizione_fisica: 34 p., cov,  59 cm;
autore: Kernighan, Brian W.; autore: Ritchie, Dennis M.;  titolo: Il linguaggio C (seconda Edizione); editore: Jackson Libri; anno: 1989; nota: Edizione italiana; collocazione: Z.22.56; luogo_pubblicazione: Milano; descrizione_fisica: 359 p., softcov,  13 cm;
autore: Kernighan, Brian W.; autore: Pike, Rob;  titolo: Programmazione nella Pratica; editore: Addison-Wesley Longman Italia Editoriale; anno: 1999; nota: Edizione italiana; collocazione: Z.24.56; luogo_pubblicazione: Milano; descrizione_fisica: 294 p., softcov,  13 cm; prestito: 13-07-2012;
autore: Singh, Jaswinder Pal; autore: Culler, David E.;  autore: Gupta,Anoop; titolo: Parallel Computer Architecture: A Hardware/Software Approach; editore: Morgan Kaufmann; anno: 1999; nota:  Copia M. Fillo; collocazione: QA76 58; luogo_pubblicazione: San Francisco, CA; descrizione_fisica: 1021 p., cov, ill,  23 cm;
autore: Hennessy, John L.; autore: Patterson, David A.;  titolo: Computer Architecture, Fifth Edition: A Quantitative Approach   ; editore:  Morgan Kaufmann; anno: 2011; nota: ; collocazione: HHH.56; luogo_pubblicazione: San Francisco, CA; descrizione_fisica: 896 p., softcov, 7 1/2 X 9 1/4 inc;
autore: Luccio, Fabrizio; autore: Pagli, Linda;  autore: Steel, Graham;titolo:Mathematical and Algorithmic Foundations of the Internet ; editore: CRC Press, Taylor and Francis Group; anno: 2011; nota: Chapman & Hall/CRC Applied Algorithms and Data Structures series; collocazione: Z.DDf.56; luogo_pubblicazione: New York; descrizione_fisica: 434 p., softcovcov,  22 cm;
autore : Di Ciccio   , Antonio; titolo: Manuale di architettura pisana; editore: Palestro; anno: 1990; luogo_pubblicazione: Milano; prestito: 10-0-2012; collocazione: B.23.4;descrizione_fisica: 123 p., ill,  23 cm;
autore: Melis, Antonio Pietro Angelo; autore: Gatto Magnolfi, Gianni;  titolo:Manuale di architettura fiorentina; editore: EQR; anno: 1910; nota:  Copia del Vescovo; collocazione: Z;12.56; luogo_pubblicazione: Firenze; descrizione_fisica: 34 p., cov,  59 cm;
autore: Melis, Antonio Pietro Angelo; autore:, Gianni;  titolo:Manuale di architettura fiorentina; editore: EQR; anno: 1910; nota:  Copia del Vescovo; collocazione: Z.12.56; luogo_pubblicazione: Firenze; descrizione_fisica: 34 p., cov,  59 cm;
autore: Singh, Jaswinder Pal; autore: Culler, David E.;  autore: Gupta,Anoop; titolo: Parallel Computer Architecture: A Hardware/Software Approach; editore: Morgan Kaufmann; 1999; nota:  Copia M. Fillo; collocazione: QA76 58; luogo_pubblicazione: San Francisco, CA; descrizione_fisica: 1021 p., cov, ill,  23 cm; 
autore: Hennessy, John L.; autore: Patterson, David A.;  titolo: Computer Architecture, Fifth Edition: A Quantitative Approach   ; editore:  Morgan Kaufmann; anno: 2011; nota: ; collocazione: HHH.56; luogo_pubblicazione: San Francisco, CA; descrizione_fisica: 896 p.; softcov, 7 1/2 X 9 1/4 inc; 
autore: Luccio, Fabrizio; autore: Pagli, Linda;  autore: Steel, Graham;titolo:Mathematical and Algorithmic Foundations of the Internet ; editore: CRC Press, Taylor and Francis Group; anno: 2011; nota: Chapman & Hall/CRC Applied Algorithms and Data Structures series; collocazione: Z.DDf.56; luogo_pubblicazione: New York; descrizione_fisica: 434 p., softcovcov,  22 cm
autore: Melis, Antonio Pietro Angelo; autore: Gatto Magnolfi, Gianni;  titolo: Manuale di architettura fiorentina; editore: EQR; anno: 2010; nota:  Copia del Vescovo; prestito: f; volume: 5; Scaffale; B.12;

每一行都以\nand 结尾,最后一行EOF像往常一样以 and 结尾。当我运行代码时,在运行良好到中间文件后,我在 linux 终端中看到了这个错误

*** glibc detected *** ./prova: double free or corruption (!prev): 0x00000000017e8250 ***
======= Backtrace: =========
/lib/x86_64-linux-gnu/libc.so.6(+0x7e626)[0x7f0049d92626]
./prova[0x400880]
/lib/x86_64-linux-gnu/libc.so.6(__libc_start_main+0xed)[0x7f0049d3576d]
./prova[0x4006a9]
======= Memory map: ========
00400000-00401000 r-xp 00000000 08:01 18770                              /home/arrigo/Desktop/prova
00600000-00601000 r--p 00000000 08:01 18770                              /home/arrigo/Desktop/prova
00601000-00602000 rw-p 00001000 08:01 18770                              /home/arrigo/Desktop/prova
017e8000-01809000 rw-p 00000000 00:00 0                                  [heap]
7f0049afe000-7f0049b13000 r-xp 00000000 08:01 5697                       /lib/x86_64-linux-gnu/libgcc_s.so.1
7f0049b13000-7f0049d12000 ---p 00015000 08:01 5697                       /lib/x86_64-linux-gnu/libgcc_s.so.1
7f0049d12000-7f0049d13000 r--p 00014000 08:01 5697                       /lib/x86_64-linux-gnu/libgcc_s.so.1
7f0049d13000-7f0049d14000 rw-p 00015000 08:01 5697                       /lib/x86_64-linux-gnu/libgcc_s.so.1
7f0049d14000-7f0049ec7000 r-xp 00000000 08:01 5676                       /lib/x86_64-linux-gnu/libc-2.15.so
7f0049ec7000-7f004a0c6000 ---p 001b3000 08:01 5676                       /lib/x86_64-linux-gnu/libc-2.15.so
7f004a0c6000-7f004a0ca000 r--p 001b2000 08:01 5676                       /lib/x86_64-linux-gnu/libc-2.15.so
7f004a0ca000-7f004a0cc000 rw-p 001b6000 08:01 5676                       /lib/x86_64-linux-gnu/libc-2.15.so
7f004a0cc000-7f004a0d1000 rw-p 00000000 00:00 0 
7f004a0d1000-7f004a0f3000 r-xp 00000000 08:01 5656                       /lib/x86_64-linux-gnu/ld-2.15.so
7f004a2d2000-7f004a2d5000 rw-p 00000000 00:00 0 
7f004a2ee000-7f004a2f3000 rw-p 00000000 00:00 0 
7f004a2f3000-7f004a2f4000 r--p 00022000 08:01 5656                       /lib/x86_64-linux-gnu/ld-2.15.so
7f004a2f4000-7f004a2f6000 rw-p 00023000 08:01 5656                       /lib/x86_64-linux-gnu/ld-2.15.so
7fff9a14f000-7fff9a170000 rw-p 00000000 00:00 0                          [stack]
7fff9a1ff000-7fff9a200000 r-xp 00000000 00:00 0                          [vdso]
ffffffffff600000-ffffffffff601000 r-xp 00000000 00:00 0                  [vsyscall]
Aborted

任何人都可以帮我“翻译”这个错误吗?

- - - - - - - - - -编辑 - - - - -

发现错误。通过代码中的一些 printf ,我发现了“ free(a) ”中的错误,但我不明白为什么它会产生这样的错误......

- - - - -编辑 - - - - - -

我发现了真正的问题......程序失败的受控行以终止符后的空白;结束......在某种程度上,free(a)发疯了

4

1 回答 1

1

您的问题是您没有分配足够的内存来存储您的行(如 R.. 的评论中所示)。您可以通过打印所strlen读内容的 和 的值来发现这一点size。他们是一样的。这意味着fscanf当它写入终止NUL字符时将溢出输入缓冲区,这会破坏堆。您收到的错误消息是glibc抱怨其损坏状态。

它没有发生在第一行输入的原因不是很重要,因为超出分配的内存写入会导致未定义的行为,而未定义的行为包括它不会导致问题。程序应该修复未定义的行为,不仅因为它是正确的做法,还因为它最终可能会导致问题。

您可以通过在扫描字符串中指定最大长度说明符来避免该问题,但您必须在缓冲区中构建扫描字符串才能实现这一点。

char fmt[64];
snprintf(fmt, sizeof(fmt), "%%%d[^\n]", size);
check = fscanf(fp, fmt, a);

但是您还必须添加代码来检查您是否真的阅读了完整的行。您可能想要进行的修复是将分配的大小增加一以解决终止NUL. 但是,解决此问题后,您的程序将处于无限循环中。这是因为您的getc循环没有检查EOF. 你需要添加它。

int c;
while ((c = getc(fp)) != '\n') {
    if (c == EOF) {
        end = 1;
        break;
    }
    size = size + 1;
}
if (!end) {
    //...
}

您的第二个扫描字符串%[^\EOF]可能不是您认为的意思。无论如何,没有真正的方法可以告诉fscanf扫描到文件末尾。如果check失败,则更容易报告失败并退出。然后,您可以稍后找出您的输入导致它失败的原因,并修复输入。

fscanf由于处理自由格式输入存在各种危险,因此使用起来很棘手。缓冲区溢出是一个问题,但如果输入的格式不符合您的预期,该函数也可能出现意外行为。这就是为什么程序员会建议无条件地将输入读入缓冲区,并解析缓冲区,而不是fscanf同时读取和解析输入。

您可以实现一些简单的代码,仅fgets用于获取一行,但需要进行一些复制。如果缓冲区不以 a 结尾,则将缓冲区的大小调整得更大\n,然后继续阅读。

size_t size = 256;
char *line = malloc(size);
line[size-2] = '\0';
while (fgets(line, size, fp) != 0) {
    while (line[size-2] && line[size-2] != '\n') {
        char *bigger_line = realloc(line, 2*size);
        assert(bigger_line); // rudimentary error handling
        size *= 2;
        line = bigger_line;
        line[size-2] = '\0';
        if (fgets(line + size/2 - 1, size/2 + 1, fp) == 0) {
            // last line doesn't end with '\n'
            break;
        }
    }
    //... handle input line
}
//...
free(line);
于 2012-07-03T15:04:56.787 回答