5

我正在尝试使用 xlrd 从 Excel 文件中读取值。到目前为止,它在日期、数字和文本方面一直表现出色。我有一列(类别),其中包含包含文本的单元格(单元格被格式化为文本)。当我打印出单元格值时,会显示一个浮点数而不是文本。我还打印了要检查的 Cell 对象的 ctype,它显示为 Number。我已经阅读了 xlrd 的文档和教程,但似乎无法找到发生这种情况的原因。会不会是我的excel文件搞砸了?对正确方向的任何建议或指示?

import xlrd
import datetime

workbook = xlrd.open_workbook('training.xls')
courseSheet = workbook.sheet_by_index(0)

for row in range(courseSheet.nrows):
    title = courseSheet.cell_value(row, 2)
    date = courseSheet.cell_value(row, 4)
    date = datetime.datetime(*xlrd.xldate_as_tuple(date, workbook.datemode))
    dateTuple = date.timetuple()
    category = courseSheet.cell_value(row, 7)
    print category
4

2 回答 2

4

背景:对于每个单元格,xlrd 报告存储在 XLS 文件中的内在值(如果有)。最初仅根据文件中的记录类型分配值类型(例如,NUMBER 和 RK 记录包含浮点数)。它对此处描述的格式进行分类,并使用该信息来覆盖值类型,其中很明显是日期时间、日期或时间而不是数字。xlrd 并不声称能够根据单元格的格式呈现单元格值。

有问题的单元格显然是作为数字输入的。如果他们已经应用了文本格式,那不会使它们成为“文本单元格”。

你说“”“当我打印出单元格值时,会显示一个浮点数而不是文本”“”......请举例说明(a)创建文件时在单元格中输入了什么(b)什么是“单元格被格式化为文本”的证据(c)什么是repr(cell.value)(d)您希望显示的“文本”是什么?

您可能会发现以下代码很有用:

import xlrd, sys

def dump_cell(sheet, rowx, colx):
    c = sheet.cell(rowx, colx)
    xf = sheet.book.xf_list[c.xf_index]
    fmt_obj = sheet.book.format_map[xf.format_key]
    print rowx, colx, repr(c.value), c.ctype, \ 
        fmt_obj.type, fmt_obj.format_key, fmt_obj.format_str

book = xlrd.open_workbook(sys.argv[1], formatting_info=1)
sheet = book.sheet_by_index(0)
for rowx in xrange(sheet.nrows):
    for colx in xrange(sheet.ncols):
        dump_cell(sheet, rowx, colx)
于 2011-12-17T23:41:03.863 回答
0

我和 OP 有同样的问题,我想我已经得出结论,在某些情况下,python(xlrd)方面没有解决方案。您将受数据最初输入到 Excel 工作表的方式的支配。具体来说,如果将数据输入到已经应用了正确“文本”格式的单元格中,或者如果将数据输入到具有默认“常规”格式的单元格中,然后单元格的格式更改为“输入数据后的文本'。

如果您将数据输入到预先格式化的单元格中,您的数字数据将被标记为带有一个 excel 警告标记,表明您在单元格中具有文本格式的数字数据。在这种情况下,xlrd 将按照您的预期处理数据 - 返回出现在 excel 工作表中的字符串。(例如,在 excel 中读取为“1”的单元格内容和 xlrd 将返回“1”作为单元格值)

但是,如果您在输入数字数据后更改单元格的格式,那么您最终会遇到 excel 中的数据显示为“1”,但 xlrd 将返回单元格值“1.0”的情况。如果您检查此单元格的 xlrd cell.ctype,您将看到该单元格仍被视为数字,即使 Excel 中的格式已更改为文本。

一种可能的解决方案可能是将您的 excel 字符串数据用引号括起来。这将禁止 excel 从一开始就将数据视为数值。

于 2013-07-11T15:19:00.897 回答