0
import re

##EDIT  didn't mean to copy filename = "rr.txt" ## opens file unicode file type
buffer = open('r.txt','r').read()

quotes = re.findall(ur'"[^"^\u201c]*["\u201d].*', buffer)
for quote in quotes:
    print ''
    print quote
## prints quotes found
## Problem is that the print output has rectangular blocks between each Character 

为什么?

如何在没有矩形块弄乱一切的情况下返回输出?

4

2 回答 2

4

你打开不正确。而 Windows 中的“Unicode”实际上是 UTF-16LE。

buffer = codecs.open('r.txt', 'r', encoding='utf-16le').read()
于 2012-05-11T15:10:48.537 回答
2

这与 Python 无关。您的控制台窗口呈现 Python 的输出,这会中断。

在控制台窗口中使用支持必要 Unicode 字符的字体。

于 2012-05-11T15:04:16.560 回答