有没有办法以不区分大小写的方式识别特定模式?
例如,如果我有
literal_bool = L"True|False";
this->self.add(literal_bool, TokenId_LiteralBool);
如何匹配true
, TRUE
,tRuE
同时避免[Tt][Rr][Uu][Ee]
为每个关键字编写?
有没有办法以不区分大小写的方式识别特定模式?
例如,如果我有
literal_bool = L"True|False";
this->self.add(literal_bool, TokenId_LiteralBool);
如何匹配true
, TRUE
,tRuE
同时避免[Tt][Rr][Uu][Ee]
为每个关键字编写?
支持的正则表达式boost::spirit::lex
包括区分大小写的控件:
(?r-s:pattern)
在解释模式时应用选项'r'并省略选项's'。选项可以是零个或多个字符
'i'
或's'
.'i'
表示不区分大小写。'-i'
表示区分大小写。's'
改变 '.
' 语法的含义以匹配任何单个字符。'-s'
改变 '.
' 的含义以匹配除 '\n
' 之外的任何字符。
因此你可以写:
literal_bool = L"(?i:true|false)";
this->self.add(literal_bool, TokenId_LiteralBool);
原始答案
引入一个使模式不区分大小写的函数:
literal_bool = L"True|False";
this->self.add(make_case_insensitive(literal_bool), TokenId_LiteralBool);
常规(非宽)字符串的实现:
std::string make_case_insensitive(const std::string& s)
{
std::string r;
std::string cC = "[xX]";
for(char c : s)
{
if ( std::isalpha(c) )
{
cC[1] = std::tolower(c);
cC[2] = std::toupper(c);
r += cC;
}
else
r += c;
}
return r;
}