3

我正在尝试使用绘图字符编写 tiff 图像,但所有有问题的字符都显示为:这个图片

方框绘制字符(例如“┌─┐│└┘╞═╡╤╧╘╛”)直接粘贴到源代码中,保存到文本文件时它们正确显示,但我不明白为什么它们'没有出现在图像上。

这是我用来绘制图像的代码示例:

# coding=utf-8
text = "┌─┐│└┘╞═╡╤╧╘╛"
from PIL import Image, ImageDraw, ImageFont, TiffImagePlugin
img = Image.new("1",(1200,1600),1)
font = ImageFont.truetype("cour.ttf",14,encoding="unic")
draw = ImageDraw.Draw(img)
draw.text((40,0), text, font=font, fill=0)
img.save("imagefile.tif","TIFF")

我在 Windows 7 上使用 python 版本 2.7.2。

4

1 回答 1

8

我不确定其中哪一个是您的问题,因为有多种方法可以解决此问题,因此我将介绍所有可能性:

首先,确保文件实际保存为 UTF-8。默认情况下,记事本和许多其他编辑器将以您的系统编码保存文件,这可能类似于 cp1252。测试“看起来正确”和“当脚本将这些字符写入文件并且我在记事本中打开该文件时,它看起来正确”并不能告诉您任何信息;显然,如果您保存一个 cp1252 文件并将其作为 cp1252 打开,它看起来是正确的。

只需在顶部添加“coding=utf-8”并不会神奇地改变文件的保存方式(除了一些智能编辑器,如 emacs)。它只是告诉 Python“这个源文件是 UTF-8”,即使它真的是别的东西。因此,Python 最终将您的 cp1252 解释为 UTF-8 并获得 mojibake,就像用 a-with-circumflex 代替画线字符一样。

您通常最好使用显式反斜杠转义,例如\u250c代替┌─,特别是如果您甚至不知道如何判断文件是否为 UTF-8,更不用说如何修复它了。

其次,您几乎不想将非 ASCII 字符放入str文字中;unicode除非您有充分的理由不这样做,否则请使用文字。

最重要的是,如果您传递draw.text一个str,PIL 将使用您的默认字符集对其进行解码——这可能又不是 UTF-8。因此,即使到目前为止所有其他内容都是正确的,您的代码也会移交一些 UTF-8 以解析为 cp1252,所以再次mojibake。使用unicode文字可以完全避免这个问题;否则,您需要通过text.decode('utf-8').

把所有这些放在一起:

text = u"\u250c\u2500\u2510\u2502\u2514\u2518\u255e\u2550\u2561\u2564\u2567\u2558\u255b"

现在编码声明和用于保存文件的实际编码无关紧要,因为文件是纯 ASCII。

但是您可能仍然会得到缺少字符的矩形,因为许多字体没有画线字符。我不知道你cour.ttf的字体是什么,但我在我的系统上发现了两种 Courier TTF 字体,一种来自旧的 Mac OS,一种来自 Windows XP,但都没有。如果这是您的问题,您显然需要使用不同的字体。

另一种可能性:如果您仍然使用上述修复程序获得 mojibake,则cour.ttf可能不是 Unicode 排序的字体文件,而是较旧的 TTF 顺序之一。字体查看器应该会显示文件的 TTF 顺序。(我很确定 Windows 自带一个,但我不知道它在 Windows 7 中的位置或如何使用它。)然后你需要在加载字体时传递正确'unic'的东西来代替。encoding但是大多数不是unic或者symb可能没有画线字符的字体。

于 2013-09-10T22:03:40.827 回答