所以你想创建一个列表列表......我们需要从一个空列表开始
list_of_lists = []
接下来,我们逐行读取文件内容
with open('data') as f:
for line in f:
inner_list = [elt.strip() for elt in line.split(',')]
# in alternative, if you need to use the file content as numbers
# inner_list = [int(elt.strip()) for elt in line.split(',')]
list_of_lists.append(inner_list)
一个常见的用例是列数据,但我们的存储单元是文件的行,我们已经一一读取,因此您可能想要转置
列表列表。这可以用以下成语来完成
by_cols = zip(*list_of_lists)
另一个常见用途是为每一列命名
col_names = ('apples sold', 'pears sold', 'apples revenue', 'pears revenue')
by_names = {}
for i, col_name in enumerate(col_names):
by_names[col_name] = by_cols[i]
以便您可以对同质数据项进行操作
mean_apple_prices = [money/fruits for money, fruits in
zip(by_names['apples revenue'], by_names['apples_sold'])]
我写的大部分内容都可以使用csv
标准库中的模块加速。另一个第三方模块是pandas
,它可以让您自动化典型数据分析的大部分方面(但有许多依赖项)。
更新虽然在 Python 2 中zip(*list_of_lists)
返回一个不同的(转置的)列表列表,但在 Python 3 中情况发生了变化,并zip(*list_of_lists)
返回了一个不可下标的zip 对象。
如果您需要索引访问,您可以使用
by_cols = list(zip(*list_of_lists))
它为您提供了两个 Python 版本中的列表列表。
另一方面,如果您不需要索引访问并且您想要的只是构建一个按列名索引的字典,那么一个 zip 对象就可以了......
file = open('some_data.csv')
names = get_names(next(file))
columns = zip(*((x.strip() for x in line.split(',')) for line in file)))
d = {}
for name, column in zip(names, columns): d[name] = column