2

我相信我在这方面没有做错:

sed -e "s_//[01]\.thumbs\.4chan\.org/[a-z0-9]\+/src/\([0-9]\*\)s\.jpg_/${LOC}/\1s.jpg_g" -e "s_//images\.4chan\.org/[a-z0-9]\+/src/\([0-9]\*\)\.\(jpg\|gif\|png\)_/${LOC}/\1.\2_g" $LOC.html > a

有人能告诉我为什么它不能将在线链接转换为离线链接吗?

4

2 回答 2

2

我认为\*\+应该是*+?否则,它会按字面意思查找*and +

于 2012-04-20T08:38:31.310 回答
1

sed在简单的正则表达式模式下使用,就像你所做的那样,+必须\+像你所做的那样转义到 ,并且正如“预期”的那样,星号*需要是 asis,即。没有逃脱。这里有几个测试,使用\+*

如果您想简化sedextended regex模式下的使用,请使用该-r选项。你不需要逃跑 +,, (....)

echo '//0.thumbs.4chan.org/abc123/src/029s.jpg' |
    sed -n "\_//[01]\.thumbs\.4chan\.org/[a-z0-9]\+/src/\([0-9]*\)s\.jpg_p"

echo '//images.4chan.org/abc123/src/029.jpg' |
    sed -n "\_//images\.4chan\.org/[a-z0-9]\+/src/\([0-9]*\)\.\(jpg\|gif\|png\)_p"

输出:

//0.thumbs.4chan.org/abc123/src/029s.jpg
//images.4chan.org/abc123/src/029.jpg
于 2012-04-20T10:26:25.433 回答