7

xlrd用来处理 xls 文件。我的 xls 文件有两列,我的要求是确保两列的行数相等。我从中了解到help(),我们有一个row_len()寻找索引给定的行的长度,但找不到任何 for col_len。你能帮忙吗

这是我的代码

from xlrd import open_workbook
spread_sheet=open_workbook("simple.xls")
sheet1=spread_sheet.sheet_by_index(0)

#validates the no of columns in the Spread sheet
 if sheet1.ncols == 2:
  for sheet1_rows in range(sheet1.nrows):
    for sheet1_cols in range(sheet1.ncols):
        value=sheet1.cell(sheet1_rows,sheet1_cols).value
        source=sheet1.cell(sheet1_rows,0).value
        destination=sheet1.cell(sheet1_rows,1).value
    #ignores the Source and Destination Headers 
    if value not in ('Source','Destination'):
        print "Source is : %s \nDestination is : %s\n" %    (source,destination)
 else:
  print "XLS provided is not valid. Check the no of columns is 2"

除了比较下面的一些其他选项请

>>> print len(sheet1.col_values(0))
8
>>> print len(sheet1.col_values(1))
8

感谢您的回复@alecxe。相反,在我的代码中添加了几行,我在下面发现了一些东西。请告知这是否可行

 >>> print len(sheet1.col_values(0))
 6
 >>> print len(sheet1.col_values(1))
 6
 >>> sheet1.col_values(0)
 [u'A', 1.0, 1.0, 1.0, 1.0, 2.0]
 >>> sheet1.col_values(1)
 [u'B', 2.0, 2.0, 2.0, 2.0, '']
 >>> print len(filter(None,sheet1.col_values(1)))
 5
 >>>
4

1 回答 1

7

您不能len(sheet.col_values(index))用于测量列中设置了多少个单元格(列长)。col_values长度总是等于sheet.nrows

想象一下,您有以下内容input.xls

A B
1 2
1 2
1 2
1 2
  2 

然后len(sheet.col_values(0))将返回 5(以及len(sheet.col_values(1))),这是不正确的。应该是4。

相反,最好使用这样的东西:

from itertools import takewhile
import xlrd


def column_len(sheet, index):
    col_values = sheet.col_values(index)
    col_len = len(col_values)
    for _ in takewhile(lambda x: not x, reversed(col_values)):
        col_len -= 1
    return col_len


book = xlrd.open_workbook("input.xls")
sheet = book.sheet_by_index(0)

print column_len(sheet, 0)  # prints 4
print column_len(sheet, 1)  # prints 5

希望有帮助。

于 2013-06-05T09:55:11.180 回答