1

我想从空格分隔的文本文件中扫描形成向量的变量,而绊脚石(对我来说经常如此)缺乏优雅。

目前我的扫描代码需要将向量的大小描述为文件中的第一个元素:

7 : 1 3 6 8 -9 .123 1.1

这让我很困扰,因为“7”可以通过检查空白来确定。

我尝试了各种形式的 fscanf()、strtok() 等,但似乎都是蛮力的。如果不求助于 lex/yacc(不可用),有人可以提出比以下更优雅的建议吗?

typedef struct vector_tag
{
    int Length;
    double * value;
} vector;

vector v;

char buf[BIG_ENOUGH], key[BIG_ENOUGH], val[BIG_ENOUGH];

void scan_vector(FILE * fh)
{
    int i, length;
    double * data;
    char * tok;

    do {
        if (feof(fh)) return;
        fgets(buf, sizeof buf, fh);    
    } while (2 != sscanf(buf,"%[^:]:%[^\n\r]",key,val));

    length      =
    v.Length    = strtol(key,NULL,10);
    data        =
    v.value     = malloc(length * sizeof(double));

    tok = strtok(val, " "); /* I'd prefer tokenizing on whitespace */
    for (i = 0; i++ < v.Length; ) {
        * data++ = strtod(tok,NULL);;
        tok = strtok(NULL, " "); /* Again, tokenize on whitespace */
    }
}

解决方案:感谢检查的答案,我实现了:

static int scan_vector(FILE * fh, vector * v)
{
    if (1 == fscanf(fh,"%d:",& v->length))
    {
        int         i;

        v->value    = malloc(v->Length * sizeof(double));

        assert (NULL != v->value);

        for (i = 0; i < v->Length; i++)
        {
            if (fscanf(fh,"%lf",v->value + i) != 1) return(0);
        } 
        return(1);
    } 
    return(0);
} /* scan_vector() */
4

4 回答 4

1

像这样的东西有什么问题:

int scan_vector(FILE *fh)
{
    char pad[2];
    int i;
    if (fscanf(fh,"%d %1[:]", &v.Length, &pad) != 2)
        return -1;
    v.value = malloc(v.Length * sizeof(double));
    for (i = 0; i < v.Length; i++) {
        if (fscanf(fh, "%lf", &v.value[i]) != 1)
            return -1;
    }
    return 0;
}

这会尝试使用 scanf 读取向量,如果出现问题则返回 -1 错误代码。

如果你想做比这更复杂的事情,你可能最好至少使用 flex(如果不是 bison 的话)。

于 2009-06-30T19:08:37.830 回答
0

如果您使用realloc()初始malloc(). 一个常见的策略是分配一个任意n项目来启动。每当你用完空间时,你就会加倍n并调整缓冲区的大小。

或者,您可以使用链表而不是数组。链接列表比数组更好地处理插入和追加,但是您放弃了按索引访问项目的能力。

于 2009-06-30T18:24:37.987 回答
0

你的向量可以有多大?
一种方法是,

  • 将一行扫描到本地缓冲区(我认为这是一个矢量数据)
  • 扫描该本地缓冲区以计算空白分隔符(很容易编码)
  • 然后做出正确的分配
  • 并且,初始化向量

如您所见,维度'7'不必是输入的一部分。
您只需要一个足够大的本地缓冲区来容纳最长的行。
并且,一些错误处理:-)

于 2009-06-30T18:34:30.107 回答
0

这是一个不需要向量大小作为文件中第一个条目的版本:

#include <stdio.h>
#include <stdlib.h>
#include <string.h>
#include <ctype.h>

#define LINE_MAX 256
#define VECTOR_SIZE_MAX 32

struct vector
{
    size_t size;
    double *values;
};

// returns 1 on error
_Bool scan_vector(FILE *file, struct vector *v)
{
    char buffer[LINE_MAX];
    if(!fgets(buffer, sizeof(buffer), file))
        return 1;

    double values[VECTOR_SIZE_MAX];

    size_t size = 0;
    errno = 0;

    for(char *head = buffer, *tail = NULL;; ++size, head = tail)
    {
        while(isspace(*head)) ++head;
        if(!*head) break;

        if(size >= VECTOR_SIZE_MAX)
            return 1;

        values[size] = strtod(head, &tail);
        if(errno || head == tail)
            return 1;
    }

    v->size = size;
    v->values = malloc(sizeof(double) * size);
    if(!v->values) return 1;

    memcpy(v->values, values, sizeof(double) * size);

    return 0;
}

int main(void)
{
    struct vector v;
    while(!scan_vector(stdin, &v))
    {
        printf("value count: %u\n", (unsigned)v.size);
        free(v.values);
    }

    return 0;
}

出于性能原因和懒惰,最大行大小和条目数是固定的。

于 2009-06-30T20:25:37.270 回答