我有包含大量 url 的文本文件,但它们最后有时间戳,这对我来说有点多余。
http://techcrunch.com/2012/02/10/vevo-ceo-tries-to-explain-their-hypocritical-act-of-piracy-at-sundance/)16:55:40
http://techcrunch.com/2012/04/30/edmodo-hits-7m/)15:18:45
我在想,在 python 中使用正则表达式将帮助我摆脱它,但同时我可以使用Python split and replace
可以在末尾删除时间戳的操作,其输出类似于下面给定的 url
>>> url.split(")")[0]
http://techcrunch.com/2012/04/30/edmodo-hits-7m
现在我的问题是,在空间和时间方面,正则表达式样式或 python 字符串方法的性能会更好,还是有其他更好的方法。