我有一个字符串。在该字符串中是双反斜杠。我想用单个反斜杠替换双反斜杠,以便可以正确解析 unicode char 代码。
(Pdb) p fetched_page
'<p style="text-align:center;" align="center"><strong><span style="font-family:\'Times New Roman\', serif;font-size:115%;">Chapter 0<\\/span><\\/strong><\\/p>\n<p><span style="font-family:\'Times New Roman\', serif;font-size:115%;">Chapter 0 in \\u201cDreaming in Code\\u201d give a brief description of programming in its early years and how and why programmers are still struggling today...'
在这个字符串内部,您可以看到转义的 unicode 字符代码,例如:
\\u201c
我想把它变成:
\u201c
尝试1:
fetched_page.replace('\\\\', '\\')
但这不起作用——它搜索四倍反斜杠。
尝试2:
fetched_page.replace('\\', '\')
但这会导致行尾错误。
尝试 3:
fetched_page.decode('string_escape')
但这对文本没有影响。所有的双反斜杠仍然是双反斜杠。