19

我正在尝试用不同的替换模式替换字符串中的某些模式。

例子:

string test = "test replacing \"these characters\"";

我想要做的是将所有 ' ' 替换为 '_' ,并将所有其他非字母或数字字符替换为空字符串。我创建了以下正则表达式,它似乎可以正确标记,但我不确定如何(如果可能)使用regex_replace.

string test = "test replacing \"these characters\"";
regex reg("(\\s+)|(\\W+)");

替换后的预期结果是:

string result = "test_replacing_these_characters";

编辑:我不能使用 boost,这就是为什么我把它排除在标签之外。所以请不要回答包括提升。我必须用标准库来做这件事。可能是不同的正则表达式可以实现目标,或者我只是被困在做两次传球。

EDIT2:我不记得在\w我原来的正则表达式中包含了哪些字符,在查找之后我进一步简化了表达式。再次,目标是任何匹配 \s+ 都应该替换为 '_' 并且任何匹配 \W+ 都应该替换为空字符串。

4

2 回答 2

27

c++ (0x, 11, tr1) 正则表达式并非在所有情况下都真正起作用(stackoverflow) (此页面上查找短语regex以获取 gcc),因此最好使用 boost一段时间。

如果您的编译器支持所需的正则表达式,您可以尝试:

#include <string>
#include <iostream>
#include <regex>

using namespace std;

int main(int argc, char * argv[]) {
    string test = "test replacing \"these characters\"";
    regex reg("[^\\w]+");
    test = regex_replace(test, reg, "_");
    cout << test << endl;
}

以上适用于 Visual Studio 2012Rc。

编辑1:要一次替换两个不同的字符串(取决于匹配),我认为这在这里行不通。在 Perl 中,这可以很容易地在评估替换表达式 ( /eswitch) 中完成。

因此,正如您已经怀疑的那样,您需要两次通行证:

 ...
 string test = "test replacing \"these characters\"";
 test = regex_replace(test, regex("\\s+"), "_");
 test = regex_replace(test, regex("\\W+"), "");
 ...

编辑 2

如果可以在 中使用回调函数 tr()regex_replace那么您可以在那里修改替换,例如:

 string output = regex_replace(test, regex("\\s+|\\W+"), tr);

进行tr()更换工作:

 string tr(const smatch &m) { return m[0].str()[0] == ' ' ? "_" : ""; }

问题本来就解决了。不幸的是,在一些 C++11 正则表达式实现中没有这样的重载,但是 Boost有一个. 以下将与 boost 一起使用并使用一次传递:

...
#include <boost/regex.hpp>
using namespace boost;
...
string tr(const smatch &m) { return m[0].str()[0] == ' ' ? "_" : ""; }
...

string test = "test replacing \"these characters\"";
test = regex_replace(test, regex("\\s+|\\W+"), tr);   // <= works in Boost
...

也许有一天这将适用于 C++ 11或接下来的任何数字。

问候

rbo

于 2012-07-16T17:15:25.463 回答
-1

这样做的方法通常是通过使用四个反斜杠来删除影响实际 C 代码的反斜杠来完成的。然后你需要对括号进行第二次传递,然后在你的正则表达式中转义它们。

string tet = "test replacing \"these characters\"";
//regex reg("[^\\w]+");
regex reg("\\\\"); //--AS COMMONLY TAUGHT AND EXPLAINED
tet = regex_replace(tet, reg, " ");
cout << tet << endl;

regex reg2("\""); //--AS SHOWN
tet = regex_replace(tet, reg2, " "); 
cout << tet << endl;

并且一次性使用;

string tet = "test replacing \"these characters\"";
//regex reg("[^\\w]+");
regex reg3("\\\""); //--AS EXPLAINED
tet = regex_replace(tet, reg3, "");
cout << tet << endl;
于 2021-05-08T21:48:42.933 回答