python - 在 Python 2.6 中使用 openpyxl 有点挣扎

Question

抱歉，如果已经在其他地方问过这个问题。

我已经为 Python（在本例中为 2.6）导入了 openpyxl（v.1.6.1）。到目前为止它工作得很好，但我想做什么我不太清楚。

我将列出我需要首先阅读的 xlsx 文件的结构。它本质上是一个备用名册，如下所示：

A1 B1 C1 D1 YYYY/MM/DD System1 System2 System3 A2 B2 C2 D2 2013/02/11 User A User B User C A3 B3 C3 D3 2013/02/12 User D User E User F A4 B4 C4 D4 2013/02/13 User G User H User I

我需要做的是首先扫描A中的所有单元格（第1行除外，所以A2到A-infinity），然后根据我是否可以在单元格A2到A-infinity中找到今天的日期，打印与今天相关的整行日期以及用户关联的系统（因此在本例中为 B3、C3 和 D3 以及 B1、C1 和 D1）。

我可以粘贴到目前为止的内容，但数量不多：

import openpyxl  
from openpyxl import load_workbook

wb = load_workbook(filename = 'standby.xlsx', use_iterators = True)  
ws = wb.get_sheet_by_name(name = 'Sheet1') # ws is now an IterableWorksheet  
for row in ws.iter_rows(): # it brings a new method: iter_rows()  
    for cell in row:  
        print cell.internal_value

使用标准文本文件，我通常会执行以下操作：

textfile = os.open('textfile', 'r')
textfiler = textfile.readlines()
for line in textfile:
    if "today's date" in line:
        print line

我只是不确定如何使用 openpyxl 处理带有 xlsx 文件的文本文件。谁能给我一个提示如何去做？

我想我需要做的是扫描 A 下的所有内容（不知道该怎么做），匹配今天的日期（我想我能弄清楚的日期），然后打印出整行（Bxxx，Cxxx， Dxxx 等）如果找到今天的日期（也不知道如何执行此操作）。

希望我可以解释我的问题，但如果没有，请告诉我，我会再试一次。

编辑：多亏了格伦，我想我比以前更进一步了，但还没有完全到达那里。我到目前为止的代码：

import openpyxl
from openpyxl import load_workbook

def find_row(today, ws):
    for a in ws.iter_rows():
        if today == a.internal_value:
            return (a)

def main():
    wb = load_workbook(filename = 'standby.xlsx', use_iterators = True)
    ws = wb.get_sheet_by_name(name = 'Sheet1') # ws is now an IterableWorksheet
    today = '2013-02-12 00:00:00' #whatever date format you're using
    row = find_row(today, ws)
    print row

def test():
    wb = load_workbook(filename = r'standby.xlsx')
    sheet_ranges = wb.get_sheet_by_name(name = 'Sheet1')
    print sheet_ranges.cell('A2607').value # D18

if __name__ == '__main__':
    main()

我现在遇到的错误是“AttributeError：'tuple'对象没有属性'internal_value'”（仍在谷歌搜索这个）。

def find_row 部分以前看起来像这样：

def find_row(today, ws):
    for a in ws.rows():
        if today == a.internal_value:
            return (a)

这提供了以下内容： NotImplementedError: use 'iter_rows()' instead

编辑#2：感谢 Glen Swinfield 的帮助和耐心，我想我终于弄明白了。这是代码现在的样子（如果看起来有点乱，请原谅，原来电子表格中有很多列）：
import datetime import openpyxl from openpyxl import load_workbook

def find_row(today, ws):
    for a1,a2,a3,a4,a5,a6,a7,a8,a9,a10,a11,a12,a13,a14,a15,a16,a17,a18,a19,a20,a21,a22,a23,a24,a25,a26,a27,a28,a29,a30,a31,a32,a33,a34,a35,a36,a37,a38,a39,a40,a41,a42,a43,a44,a45,a46,a47,a48,a49,a50,a51,a52,a53,a54,a55,a56,a57,a58,a59,a60,a61,a62,a63,a64,a65,a66,a67,a68,a69,a70,a71,a72,a73,a74,a75,a76,a77,a78,a79,a80,a81,a82,a83,a84,a85,a86,a87,a88,a89,a90,a91,a92,a93 in ws.iter_rows():
        if today == a1.internal_value:
            print(a1.internal_value,a2.internal_value,a3.internal_value,a4.internal_value,a5.internal_value,a6.internal_value,a7.internal_value,a8.internal_value,a9.internal_value,a10.internal_value,a11.internal_value,a12.internal_value,a13.internal_value,a14.internal_value,a15.internal_value,a16.internal_value,a17.internal_value,a18.internal_value,a19.internal_value,a20.internal_value,a21.internal_value,a22.internal_value,a23.internal_value,a24.internal_value,a25.internal_value,a26.internal_value,a27.internal_value,a28.internal_value,a29.internal_value,a30.internal_value,a31.internal_value,a32.internal_value,a33.internal_value,a34.internal_value,a35.internal_value,a36.internal_value,a37.internal_value,a38.internal_value,a39.internal_value,a40.internal_value,a41.internal_value,a42.internal_value,a43.internal_value,a44.internal_value,a45.internal_value,a46.internal_value,a47.internal_value,a48.internal_value,a49.internal_value,a50.internal_value,a51.internal_value,a52.internal_value,a53.internal_value,a54.internal_value,a55.internal_value,a56.internal_value,a57.internal_value,a58.internal_value,a59.internal_value,a60.internal_value,a61.internal_value,a62.internal_value,a63.internal_value,a64.internal_value,a65.internal_value,a66.internal_value,a67.internal_value,a68.internal_value,a69.internal_value,a70.internal_value,a71.internal_value,a72.internal_value,a73.internal_value,a74.internal_value,a75.internal_value,a76.internal_value,a77.internal_value,a78.internal_value,a79.internal_value,a80.internal_value,a81.internal_value,a82.internal_value,a83.internal_value,a84.internal_value,a85.internal_value,a86.internal_value,a87.internal_value,a88.internal_value,a89.internal_value,a90.internal_value,a91.internal_value,a92.internal_value,a93.internal_value)

def main():
    wb = load_workbook(filename = 'standby.xlsx', use_iterators = True)
    ws = wb.get_sheet_by_name(name = 'Sheet1') # ws is now an IterableWorksheet
    today = datetime.datetime(2013, 02, 12, 0, 0) #whatever date format you're using
    row = find_row(today, ws)

def test():
    wb = load_workbook(filename = r'standby.xlsx')
    sheet_ranges = wb.get_sheet_by_name(name = 'Sheet1')
    print sheet_ranges.cell('A2607').value # D18

if __name__ == '__main__':
    main()

score 2 · Accepted Answer

我现在无法对此进行测试，但原则上您需要遍历每一行，边走边解开单元格，然后检查单元格 A 是否有今天的日期，如果有，则返回该行。

import openpyxl  
from openpyxl import load_workbook

def find_row(today, ws):
    for a,b,c,d in ws.rows():
        if today == a.internal_value:
            return (a, b, c, d)
    raise someException('row not found')

wb = load_workbook(filename = 'standby.xlsx', use_iterators = True)  
ws = wb.get_sheet_by_name(name = 'Sheet1') # ws is now an IterableWorksheet
today = '' #whatever date format you're using
try:
    row = find_row(today, ws) 
except someException:
    # handle exception

在 python 中有几种方法可以做到这一点，例如 while/else 循环，但这是它的本质。

更新回复评论：

def find_row(today, ws):
    for a,b,c,d in ws.iter_rows():
        if today == a.internal_value:
            return (a, b, c, d)
    raise someException('row not found')

该use_iterators = True标志意味着您获得了一个迭代器，因此您必须使用iter_rows()而不仅仅是.rows.

python - 在 Python 2.6 中使用 openpyxl 有点挣扎

1 回答 1

Related

Reference