我正在尝试在 python 中实现以下替换。用 {n} 替换所有 html 标签并创建 [tag, {n}] 的哈希
原始字符串 -> “<h>
这是一个字符串。</H><P>
这是另一部分。</P>
”
替换文本 -> “{0} 这是一个字符串。{ 1}{2}这是另一部分。{3}"
这是我的代码。我已经开始替换,但我坚持替换逻辑,因为我无法找出以连续方式替换每个事件的最佳方法,即使用 {0}、{1} 等:
import re
text = "<h> This is a string. </H><p> This is another part. </P>"
num_mat = re.findall(r"(?:<(\/*)[a-zA-Z0-9]+>)",text)
print(str(len(num_mat)))
reg = re.compile(r"(?:<(\/*)[a-zA-Z0-9]+>)",re.VERBOSE)
phctr = 0
#for phctr in num_mat:
# phtxt = "{" + str(phctr) + "}"
phtxt = "{" + str(phctr) + "}"
newtext = re.sub(reg,phtxt,text)
print(newtext)
有人可以帮助以更好的方式实现这一目标吗?谢谢!