1

我对脚本很陌生,但我想学习它。我要做的是从文本文件中删除所有出现的 http://* 之类的东西。我想用 sed 命令和正则表达式来做。

到目前为止,这是我所做的:

sed 's/http:\/\/.*/ /' < input.txt > output.txt

此代码用空格替换所有超链接。但问题是它也删除了该行的其余部分。

我该如何解决这个问题?我尝试添加空格、“http://.*”或单词结尾“http://.*\>”或我在互联网上找到的其他技巧,但它们不起作用。

有没有比使用 sed 更好的方法呢?

4

1 回答 1

0

Sed 是一个很好的方法来做到这一点。尝试将您的正则表达式更改为s!http://[^[:space:]]*! !g.

于 2013-10-31T17:40:40.663 回答