我正在努力编写一个与 perl 兼容的正则表达式,该表达式在区分指刚果共和国和刚果民主共和国的字符串方面相当聪明。我将在R
'grep
函数的程序中使用这个表达式,如果正则表达式匹配字符串,则返回 True,否则返回 False。
我有兴趣识别的国家有时可以用不同的顺序/方式书写。例如:
刚果共和国
刚果共和国
刚果共和国
刚果共和国
我不想匹配的国家有类似的模式:
democratic republic of the congo
congo, democratic republic of the
dem rep of the congo
我想,我正在寻找的是一个匹配 rep 和 congo 的正则表达式,但只要字符串中有一个“dem”就会失败。
有任何想法吗?谢谢!