我正在使用 VisualStudio2010 通过 PCRE 进行一些正则表达式匹配。假设我有一个模式和一个主题,std::wstring
如下所示:
std::wstring subject = L"サービス内容";
std::wstring pattern = L"ス内";
如您所见,我尝试定位日语字符串,因此我需要采用 PCRE 的 unicode 变体,例如 pcre16 或 pcre32 与函数pcre16_exec
等pcre32_exec
。
不幸的是,它不起作用。我的问题似乎是从wstring
unsigned short 或 unsigned int 转换(取决于 pcre16 或 pcre32)。我尝试了很多功能(wcstombs_s、使用 QString 进行字符串转换等)但没有成功。exec 函数的结果永远不会保持我期望的正确值。我不太确定出了什么问题 - 使用简单的 pcre 函数与 ansi 字符串进行模式匹配工作正常。这是一个片段:
pcre16 *re;
const char *error;
int erroffset;
int ovector[30]; //The reult of the matching
int subject_length;
int rc;
std::wstring subjectstr = L"サービス内容";
std::wstring patternstr = L"ス内";
subject_length = 6;
const unsigned short pattern = ....// string conversion from patternstr
const insigned short subject = ....// string conversion from subjectstr
re = pcre16_compile(&pattern, PCRE_UTF16, &error, &erroffset, NULL);
rc = pcre16_exec(re, NULL, &subject, subject_length, 0, 0, ovector, 30);
有人可以给我一个关于如何使用 PCRE 检测 unicode 模式或解释出了什么问题的工作示例吗?我对自己感到愤怒。