0

我有一个包含大约数千行的文件。每一行的格式如下:

02:17:15.204    1.217   890 322 GET 200 text/html   http://stage.youbeauty.com/body-fitness/galleries/gluten-free-bodycare
02:17:16.530    0.304   313 (7592)  GET (Cache) text/javascript http://use.typekit.com/lqi6pyj.js
02:17:16.534    0.769   463 (8631)  GET 304 text/css    http://stage.assets0.youbeauty.com/rel-20120404171521/assets/vendor.css
02:17:16.537    1.514   419 32963   GET 200 text/css    http://stage.assets0.youbeauty.com/rel-20120404171521/assets/application1.css

我只想借助 NOtepad++ 中的“查找和替换”功能获取 URL。

(如果我们使用 java script 之类的任何脚本也可以)

4

2 回答 2

2

使用正则表达式选项和这个搜索词:

http.*

这将选择从http行尾到行尾的所有内容。

如果要删除每行中除 URL 之外的所有内容,请使用以下命令:

Find what: .*(http.*)
Replace with: \1
于 2012-04-05T11:43:08.213 回答
2

我写了一个python脚本。这是http://ideone.com/TkK5e。希望能帮助到你。

于 2012-04-05T11:51:56.357 回答