5

Aloha,我一直在试图弄清楚如何在两个占位符之间替换/插入文本字符串。

#start
REPLACE ANYTHING IN HERE
#end

最初我试图通过 sed 使用 BASH 执行此操作,但是当我尝试将变量传递给 sed 时遇到了障碍。

sed -n -i '/#start/{p;:a;N;/#end/!ba;s/.*\n/hello\n/};p' file.txt

退货

#start
hello
#end

但是当我尝试时没有快乐

sed -n -i '/#start/{p;:a;N;/#end/!ba;s/.*\n/$replace_var\n/};p' file.txt

或者

sed -n -i "/#start/{p;:a;N;/#end/!ba;s/.*\n/$replace_var\n/};p" file.txt

我已经在这几个小时了,并且已经四处搜索但没有找到解决方案。我正在尝试使用 python 或其他语言,或者可能使用 awk。我是这个领域的新手,所以任何有用的信息都将不胜感激。

提前致谢

这就是我最后的结果。这是一个与 cron 结合使用的脚本,使用最新发布的 ssh 阻止列表更新我的 /var/etc/hosts.deny 文件。

import re
import urllib2

hosts_deny = open('/etc/hosts.deny','r+')
hosts_deny_text = hosts_deny.read()

blockedHosts = urllib2.urlopen('http://www.openbl.org/lists/hosts.deny').read()
place = re.compile('(?<=#start)(\r?\n)'
                   '(.*?)'
                   '(?=\r?\n#end)',re.DOTALL)#DOTALL enables '.' to also include
                                             #a new line
hosts_deny_text = re.sub(place, '\n'+ blockedHosts, hosts_deny_text)
hosts_deny.seek(0)
hosts_deny.write(hosts_deny_text)
hosts_deny.close()
4

5 回答 5

3

这似乎确实可以满足您的要求:

sed -ie "/#start/,/#end/{/#start/b;/#end/b;s/.*/$replace_var/;}" file.txt

内部/#start/b/#end/b跳过这些行,否则您也会替换它们。

于 2013-02-28T23:13:23.493 回答
2

鉴于您的解释,我只能提出这个简单的代码:

import re

ss = '''qslkjqskqsdhf
#start
REPLACE ANYTHING IN HERE
#end
2135468761265
'''

reg = re.compile('(?<=#start)(\r?\n)'
                 '(.*?)'
                 '(?=\r?\n#end)',re.DOTALL)

print ss
print '----'
print reg.sub('\\1Ia orana',ss)

结果

qslkjqskqsdhf
#start
REPLACE ANYTHING IN HERE
#end
2135468761265

----
qslkjqskqsdhf
#start
Ia orana
#end
2135468761265
于 2013-02-28T23:06:48.863 回答
0

您可以将文件读入字符串,然后执行以下操作:

sstart = s.split(start)
for i in range(len(s)):
   if i%2 ==1:
      send = sstart[i].split(end)
      for i in range(len(send)):
           if i%2 == 0:
                send[i] = REPLACEMENT
      sstart[i] = send.join()
s = sstart.join()

所以你基本上是遍历列表,剪掉需要更换的部分,然后将这些部分粘在一起。

于 2013-02-28T23:06:07.380 回答
0

使用“dotall”正则表达式,这很容易。这些使用 Perl、Python、PCRE 等很容易。例如,在 Python 中:

>>> s = '''#start
... REPLACE ANYTHING IN HERE
... #end'''
>>> re.sub(r'(?s)(#start\n).*?\n(#end)',
           r'\1hello\n\2', s)
'#start\nhello\n#end'

显然,匹配开始行和结束行并用它们自己替换它们是多余的,但我决定保持通用,以防你想进一步扩展它。

我使用了(?s)而不是传递re.DOTALL标志,因此所有内容都是独立的,您不必考虑 Perl、Python 等传递标志的方式之间的差异。但在现实生活中,使用标志而不是嵌入它们通常更具可读性。

于 2013-02-28T23:11:49.407 回答
0

我认为sed相当不适合这项任务,我会使用 awk 代替:

awk '!f; /#start/ { f=1; print repl } /#end/ { f=0; print }' repl="$replace_var" file.txt

f变量是一个标志,用于跟踪我们何时在标记内。!f调用默认块 ( {print $0}) 并打印标记之外的所有内容,包括#start标记。

测试

从eyquem 的答案复制的测试文件:

cat << EOF > file.txt
qslkjqskqsdhf
#start
REPLACE ANYTHING IN HERE
#end
2135468761265
EOF

将标记间内容替换为hello\nhello

awk '!f; /#start/ { f=1; print repl } /#end/ { f=0; print }' repl="$(printf 'hello\nhello')" file.txt

输出:

qslkjqskqsdhf
#start
hello
hello
#end
2135468761265
于 2013-02-28T23:55:57.353 回答