0

我的字符串有两个可能的结尾。第一个没有数字:

http://www.something.com/test.html

第二个带数字(最多两位数)

http://www.something.com/test-1.html
http://www.something.com/test-2.html
http://www.something.com/test-3.html
http://www.something.com/test-4.html
http://www.something.com/test-15.html

我需要.html从第一个案例和-1.html(或任何数字)中删除第二个案例。这个想法是使两个字符串具有可比性以查找重复项。

我认为以下应该管理第二种情况

gsub("-[0-9]|[1-9][0-9].html", "", string)

但是有可能有一个功能来管理这两种情况吗?

4

1 回答 1

2

你也许可以使用这样的东西:

(-[0-9]+)?\\.html

请注意,转义点更安全,因为未转义的点将匹配任何字符。

正则表达式101演示

于 2013-09-25T06:00:45.947 回答