我有以下字符串:
u"examined by other children\u2014particularly the children of George MacDonald."
但我找不到解码它的方法。python需要什么编码器/解码器。还有很多我想删除的“\n\nOn”前导\n。我试过 string.decode("utf-8")
TypeError:“unicode”对象不可调用
编辑:
这是维基百科爱丽丝梦游仙境中较大的一段:
u'BackgroundAlice 出版于 1865 年,也就是查尔斯·路特维奇·道奇森牧师和罗宾逊·达克沃斯牧师划船三年后,于 1862 年 7 月 4 日,[4] 与亨利·利德尔 (Henry Liddell) 的三个年幼的女儿(副校长牛津大学和基督教堂院长):Lorina Charlotte Liddell(13 岁,生于 1849 年)(本书序言中的“Prima”);Alice Pleasance Liddell(10 岁,生于 1852 年)(序言中的“Secunda”);伊迪丝·玛丽·利德尔(Edith Mary Liddell)(8 岁,生于 1853 年)(序言中的“Tertia”)。[5]\n\n旅程从牛津附近的愚蠢桥开始,在五英里外的戈德斯托村结束。在旅途中,道奇森牧师给女孩们讲了一个故事,讲述了一个名叫爱丽丝的无聊小女孩去寻找冒险的故事。女孩们喜欢它,爱丽丝·利德尔让道奇森为她写下来。第二天,他开始写这个故事的手稿,尽管那个最早的版本已经不存在了。一个月后,女孩们和道奇森再次乘船游览爱丽丝的故事情节,并于 11 月开始认真写手稿。[6]\n\n为了画龙点睛,他研究了书中介绍的动物的自然历史,然后让其他孩子\u2014特别是乔治·麦克唐纳的孩子们检查了这本书。他添加了自己的插图,但请约翰·坦尼尔为这本书配图以供出版,并告诉他这个故事很受孩子们的喜爱。[6]\n\n1864 年 11 月 26 日,他给了爱丽丝一份《爱丽丝地下历险记》的手写手稿,配以 Dodgson 本人的插图,将其作为“给亲爱的孩子的圣诞礼物,以纪念夏日”。[7] 包括马丁·加德纳(Martin Gardner)在内的一些人推测,有一个较早的版本后来被道奇森(Dodgson)手工编写了一份更精细的副本时销毁。[8]\n\n但在爱丽丝收到她的副本之前,道奇森已经在准备出版并将原版的 15,500 字扩大到 27,500 字,[9] 最值得注意的是添加了关于柴郡猫和疯狂茶会的情节。 '
我想用可以解析的纯文本格式。我得到错误:
UnicodeEncodeError:'ascii' 编解码器无法在位置 1295 编码字符 u'\u2014':序数不在范围内(128)
当我尝试paragraph.decode(“unicode_escape”)或paragraph.“string_escape”)。