3

问题

该代码无法正确识别输入(项目)。即使 CSV 文件中存在这样的值,它也会简单地转储到我的失败消息中。谁能帮我确定我做错了什么?

背景

我正在开发一个小程序,该程序要求用户输入(此处未给出函数),搜索 CSV 文件(项目)中的特定列并返回整行。CSV 数据格式如下所示。我已经从实际数量(49 个字段名称,18000+ 行)中缩短了数据。

代码

import csv
from collections import namedtuple
from contextlib import closing

def search():
    item = 1000001
    raw_data = 'active_sanitized.csv'
    failure = 'No matching item could be found with that item code. Please try again.'
    check = False

    with closing(open(raw_data, newline='')) as open_data:
        read_data = csv.DictReader(open_data, delimiter=';')
        item_data = namedtuple('item_data', read_data.fieldnames)
        while check == False:
            for row in map(item_data._make, read_data):
                if row.Item == item:
                    return row
                else:
                    return failure     

CSV 结构

active_sanitized.csv
Item;Name;Cost;Qty;Price;Description
1000001;Name here:1;1001;1;11;Item description here:1
1000002;Name here:2;1002;2;22;Item description here:2
1000003;Name here:3;1003;3;33;Item description here:3
1000004;Name here:4;1004;4;44;Item description here:4
1000005;Name here:5;1005;5;55;Item description here:5
1000006;Name here:6;1006;6;66;Item description here:6
1000007;Name here:7;1007;7;77;Item description here:7
1000008;Name here:8;1008;8;88;Item description here:8
1000009;Name here:9;1009;9;99;Item description here:9

笔记

我在 Python 方面的经验相对较少,但我认为这将是一个很好的问题,以便了解更多信息。

我确定了打开(并包装在关闭函数中)CSV 文件的方法,通过 DictReader 读取数据(以获取字段名称),然后创建一个命名元组以便能够快速选择输出所需的列(项目、成本、价格、名称)。列顺序很重要,因此使用 DictReader 和 namedtuple。

虽然有可能对每个字段名称进行硬编码,但我觉得如果程序可以在文件打开时读取它们,那么在处理具有相同列名但列组织不同的类似文件时会更有帮助。

研究

4

1 回答 1

3

你有这三个问题:

  • 你在第一次失败时返回,所以它永远不会超过第一行。
  • 您正在从文件中读取字符串,并与 int 进行比较。
  • _make迭代字典键,而不是值,产生错误的结果 ( item_data(Item='Name', Name='Price', Cost='Qty', Qty='Item', Price='Cost', Description='Description'))。

    for row in (item_data(**data) for data in read_data):
        if row.Item == str(item):
            return row
    return failure
    

这解决了手头的问题 - 我们检查字符串,并且仅在没有匹配的项目时才返回(尽管您可能希望开始将字符串转换为数据中的整数,而不是对字符串/整数问题进行这种骇人听闻的修复) .

我还改变了你循环的方式 - 使用生成器表达式可以获得更自然的语法,使用来自 dict 的命名属性的正常构造语法。这比使用_makeand更简洁、更易读map()。它还解决了问题 3。

于 2012-04-18T13:03:10.007 回答