0

我正在用 python 编写一个脚本,用于验证父表中每个单元格的值,并与查找表中的值进行比较。

因此,在父表中,我有许多列,每列对应于一个查找表,用于查找应该在该特定列中的每条记录中的已知值。

当我从父表中读取值时,会有很多类型(即 unicode 字符串、整数、浮点数、日期等)

查找表具有相同的各种类型,但是当它是字符串时,它是一个简单的字符串,而不是强制我转换值以匹配的 unicode 字符串。(即如果父表单元格中的值是unicode字符串,那么我需要创建一个条件句来测试它是否是unicode,然后转换为简单字符串

if isinstance(row.getValue(columnname), unicode):
    x = str(row.getValue(columnname)

我的问题是,将 unicode 字符串转换为简单字符串会更好,反之亦然以匹配类型?为什么会更好?

如果有帮助,我的父表都可以访问,并且查找表都在 excel 中。我认为这并不重要,但也许我错过了一些东西。

4

1 回答 1

5

最好将字节字符串解码为 un​​icode。

Unicode 数据是规范的表示;编码字节因使用的编码而异。

您总是希望在程序中使用 Unicode,然后根据需要编码回字节以通过网络发送或将数据写入文件。

将此与使用日期/时间值进行比较;您也会datetime尽快将它们转换为对象。或图像;从 PNG 或 JPG 加载图像,您会希望获得一种表示形式,可以让您操纵颜色和单个像素,这在使用磁盘上的压缩图像格式时要困难得多。

于 2013-10-18T17:28:15.080 回答