1

我想检查一个字符串是否包含|c,但是由于以下代码返回,一些非 ascii 字符会造成麻烦Match。有没有办法忽略非ASCII字符?

#include <sys/types.h>
#include <regex.h>
#include <stdio.h>
#include <stdlib.h>
#include <sys/types.h>

int main(int argc, char *argv[]){
        regex_t regex;
        int reti;
        char msgbuf[100];

/* Compile regular expression */
        reti = regcomp(&regex, "\|c", REG_EXTENDED);
        if( reti ){ fprintf(stderr, "Could not compile regex\n"); exit(1); }

/* Execute regular expression */
        reti = regexec(&regex, "<81>U¼T_<84>Ùe/^P^Rï+߶ë", 0, NULL, 0);
        if( !reti ){
                puts("Match");
        }
        else if( reti == REG_NOMATCH ){
                puts("No match");
        }
        else{
                regerror(reti, &regex, msgbuf, sizeof(msgbuf));
                fprintf(stderr, "Regex match failed: %s\n", msgbuf);
                exit(1);
        }

/* Free compiled regular expression if you want to use the regex_t again */
  regfree(&regex);

        return 0;
}
4

1 回答 1

4

输入中的非 ASCII 字符不是问题。相反,"\|c"是一种错误的写作方式"|c"(它匹配所有内容)。使用两个反斜杠(一个用于转义字符串本身的反斜杠):

    reti = regcomp(&regex, "\\|c", REG_EXTENDED);
于 2013-10-12T03:07:14.337 回答