该脚本读取一个文件,其中包含我复制粘贴的文本。它对文本数据进行一些操作并返回结果。然而,当 python 读取文件时,它会将其保存在一个带有单引号和其他一些编码的变量中,例如:、、\xe2\x80\x99
等等。仅当我从网页复制粘贴文本时才会发生这种情况。如果我在文件中输入相同的文本并随后读取该文件,则单引号和其他字符不会使用特殊字符进行转义。\xe2\x80\x9
\xe2\x80\x99
该文件的名称是“text.txt”。我使用默认将所有内容保存为 utf-8 的编辑器打开它。我打开一个新闻网页(例如:http ://www.euronews.com/2013/05/31/why-it-s-not-so-great-in-britain/ )并将文本复制到'text.txt' 文件。之后:file=open('text.txt', 'r').read()
并file
在 python2 控制台中点击。
In [62]: file=open('text.txt', 'r').read()
In [63]: file
Out[63]: 'Britain\xe2\x80\x99s generous system... David Cameron:\xe2\x80\x9c What we can do is make sure...they\xe2\x80\x99re drawn by the attractiveness...\xe2\x80\x9d'
1)你能解释一下这种行为吗?
2)如何让python在没有转义字符的情况下读取复制的文本?