2026

如何在 Python 中读取文件的每一行并将每一行作为一个元素存储在列表中?

我想逐行读取文件并将每一行附加到列表的末尾。

4

28 回答 28

2594

此代码会将整个文件读入内存:

with open(filename) as file:
    lines = file.readlines()

如果要从每行末尾删除所有空白字符(换行符和空格),请改用:

with open(filename) as file:
    lines = [line.rstrip() for line in file]

(这避免了从 分配额外的列表file.readlines()。)

如果您正在处理一个大文件,那么您应该逐行读取和处理它:

with open(filename) as file:
    for line in file:
        print(line.rstrip())

在 Python 3.8 及更高版本中,您可以使用带有海象运算符的 while 循环,如下所示:

with open(filename) as file:
    while line := file.readline():
        print(line.rstrip())
于 2010-07-18T22:28:32.463 回答
1131

请参阅输入和输出

with open('filename') as f:
    lines = f.readlines()

或剥离换行符:

with open('filename') as f:
    lines = [line.rstrip('\n') for line in f]
于 2010-07-18T22:28:10.447 回答
680

这比必要的更明确,但可以满足您的要求。

with open("file.txt") as file_in:
    lines = []
    for line in file_in:
        lines.append(line)
于 2010-07-18T22:27:26.297 回答
306

这将从文件中产生一个“数组”行。

lines = tuple(open(filename, 'r'))

open返回一个可以迭代的文件。当您遍历文件时,您会从该文件中获取行。tuple可以获取一个迭代器并从您给它的迭代器中为您实例化一个元组实例。lines是从文件的行创建的元组。

于 2010-07-18T22:27:24.383 回答
229

根据 Python 的文件对象方法,将文本文件转换为 a 的最简单方法list是:

with open('file.txt') as f:
    my_list = list(f)
    # my_list = [x.rstrip() for x in f] # remove line breaks

如果您只需要遍历文本文件行,您可以使用:

with open('file.txt') as f:
    for line in f:
       ...

老答案:

使用withreadlines()

with open('file.txt') as f:
    lines = f.readlines()

如果您不关心关闭文件,则此单行程序有效:

lines = open('file.txt').readlines()

传统方式:

f = open('file.txt') # Open file on read mode
lines = f.read().splitlines() # List with stripped line-breaks
f.close() # Close file
于 2015-04-20T05:53:10.217 回答
229

如果你想要\n包括:

with open(fname) as f:
    content = f.readlines()

如果您不想\n包含:

with open(fname) as f:
    content = f.read().splitlines()
于 2014-03-02T04:22:39.767 回答
163

正如建议的那样,您可以简单地执行以下操作:

with open('/your/path/file') as f:
    my_lines = f.readlines()

请注意,这种方法有两个缺点:

1)您将所有行存储在内存中。在一般情况下,这是一个非常糟糕的主意。该文件可能非常大,您可能会耗尽内存。就算不大,也只是浪费内存而已。

2)这不允许在您阅读它们时处理每一行。因此,如果您在此之后处理您的行,则效率不高(需要两次而不是一次)。

对于一般情况,更好的方法如下:

with open('/your/path/file') as f:
    for line in f:
        process(line)

您可以以任何方式定义您的流程功能。例如:

def process(line):
    if 'save the world' in line.lower():
         superman.save_the_world()

Superman该类的实现留给您作为练习)。

这适用于任何文件大小,您只需 1 次即可完成文件。这通常是通用解析器的工作方式。

于 2016-02-25T09:13:38.007 回答
104

具有文本文件内容:

line 1
line 2
line 3

我们可以在上面的txt同目录下使用这个Python脚本

>>> with open("myfile.txt", encoding="utf-8") as file:
...     x = [l.rstrip("\n") for l in file]
>>> x
['line 1','line 2','line 3']

使用附加:

x = []
with open("myfile.txt") as file:
    for l in file:
        x.append(l.strip())

或者:

>>> x = open("myfile.txt").read().splitlines()
>>> x
['line 1', 'line 2', 'line 3']

或者:

>>> x = open("myfile.txt").readlines()
>>> x
['linea 1\n', 'line 2\n', 'line 3\n']

或者:

def print_output(lines_in_textfile):
    print("lines_in_textfile =", lines_in_textfile)

y = [x.rstrip() for x in open("001.txt")]
print_output(y)

with open('001.txt', 'r', encoding='utf-8') as file:
    file = file.read().splitlines()
    print_output(file)

with open('001.txt', 'r', encoding='utf-8') as file:
    file = [x.rstrip("\n") for x in file]
    print_output(file)

输出:

lines_in_textfile = ['line 1', 'line 2', 'line 3']
lines_in_textfile = ['line 1', 'line 2', 'line 3']
lines_in_textfile = ['line 1', 'line 2', 'line 3']
于 2017-04-26T04:57:33.957 回答
46

要将文件读入列表,您需要做三件事:

  • 打开文件
  • 读取文件
  • 将内容存储为列表

幸运的是,Python 使这些事情变得非常容易,因此将文件读入列表的最短方法是:

lst = list(open(filename))

但是,我将添加更多解释。

打开文件

我假设您想打开一个特定的文件并且您不直接处理文件句柄(或类似文件的句柄)。在 Python 中打开文件最常用的函数是open,在 Python 2.7 中它需要一个强制参数和两个可选参数:

  • 文件名
  • 模式
  • 缓冲(我将在这个答案中忽略这个论点)

文件名应该是代表文件路径的字符串。例如:

open('afile')   # opens the file named afile in the current working directory
open('adir/afile')            # relative path (relative to the current working directory)
open('C:/users/aname/afile')  # absolute path (windows)
open('/usr/local/afile')      # absolute path (linux)

请注意,需要指定文件扩展名。这对于 Windows 用户来说尤其重要,因为在资源管理器中查看时,默认情况下.txt,像or.doc等​​文件扩展名是隐藏的。

第二个参数是moder默认情况下表示“只读”。这正是您所需要的。

但是如果你真的想创建一个文件和/或写入一个文件,你需要一个不同的参数。如果您想要概览,有一个很好的答案

要读取文件,您可以省略mode或显式传递它:

open(filename)
open(filename, 'r')

两者都将以只读模式打开文件。如果您想在 Windows 上读取二进制文件,则需要使用以下模式rb

open(filename, 'rb')

在其他平台上,'b'(二进制模式)会被简单地忽略。


现在我已经展示了如何创建open文件,让我们谈谈您总是需要close再次访问它的事实。否则,它将保持文件的打开文件句柄,直到进程退出(或 Python 垃圾文件句柄)。

虽然您可以使用:

f = open(filename)
# ... do stuff with f
f.close()

open当介于两者之间并close引发异常时,这将无法关闭文件。您可以通过使用tryand来避免这种情况finally

f = open(filename)
# nothing in between!
try:
    # do stuff with f
finally:
    f.close()

然而 Python 提供了具有更漂亮语法的上下文管理器(但open它几乎与try上述相同finally):

with open(filename) as f:
    # do stuff with f
# The file is always closed after the with-scope ends.

最后一种方法是在 Python 中打开文件的推荐方法!

读取文件

好的,您已经打开了文件,现在如何读取它?

open函数返回一个file对象,它支持 Python 的迭代协议。每次迭代都会给你一行:

with open(filename) as f:
    for line in f:
        print(line)

这将打印文件的每一行。\n但是请注意,每行末尾都将包含一个换行符(您可能需要检查您的 Python 是否使用通用换行符支持构建- 否则您也可以\r\n在 Windows 或\rMac 上作为换行符使用)。如果您不希望这样,您可以简单地删除最后一个字符(或 Windows 上的最后两个字符):

with open(filename) as f:
    for line in f:
        print(line[:-1])

但最后一行不一定有一个尾随换行符,所以不应该使用它。可以检查它是否以尾随换行符结尾,如果是,则将其删除:

with open(filename) as f:
    for line in f:
        if line.endswith('\n'):
            line = line[:-1]
        print(line)

但是您可以简单地从字符串末尾删除所有空格(包括\n字符),这也会删除所有其他尾随空格,因此如果这些很重要,您必须小心:

with open(filename) as f:
    for line in f:
        print(f.rstrip())

但是,如果行以\r\n(Windows "newlines") 结尾,那.rstrip()也将处理\r!

将内容存储为列表

现在您知道如何打开文件并阅读它,是时候将内容存储在列表中了。最简单的选择是使用该list功能:

with open(filename) as f:
    lst = list(f)

如果您想去除尾随换行符,您可以使用列表推导:

with open(filename) as f:
    lst = [line.rstrip() for line in f]

甚至更简单:对象的.readlines()方法file默认返回list以下行:

with open(filename) as f:
    lst = f.readlines()

这还将包括尾随换行符,如果您不想要它们,我会推荐这种[line.rstrip() for line in f]方法,因为它避免了在内存中保留两个包含所有行的列表。

还有一个额外的选项可以获得所需的输出,但是它相当“次优”:read字符串中的完整文件,然后在换行符上拆分:

with open(filename) as f:
    lst = f.read().split('\n')

或者:

with open(filename) as f:
    lst = f.read().splitlines()

这些会自动处理尾随的换行符,因为split不包括字符。但是它们并不理想,因为您将文件保存为字符串和内存中的行列表!

概括

  • 在打开文件时使用with open(...) as f,因为您不需要自己关闭文件,即使发生异常也会关闭文件。
  • file对象支持迭代协议,因此逐行读取文件就像for line in the_file_object:.
  • 始终浏览可用函数/类的文档。大多数时候,任务有一个完美的匹配,或者至少有一两个好的匹配。在这种情况下,显而易见的选择是,readlines()但如果您想在将这些行存储到列表中之前对其进行处理,我会推荐一个简单的列表理解。
于 2018-01-16T22:33:57.980 回答
45

将文件的行读入列表的干净和 Pythonic 方式


首先,您应该专注于以高效且 Python 的方式打开文件并读取其内容。这是我个人不喜欢的方式的一个例子:

infile = open('my_file.txt', 'r')  # Open the file for reading.

data = infile.read()  # Read the contents of the file.

infile.close()  # Close the file since we're done using it.

相反,我更喜欢以下打开文件以进行读取和写入的方法,因为它非常干净,并且在完成使用后不需要关闭文件的额外步骤。在下面的语句中,我们打开文件进行读取,并将其分配给变量“infile”。一旦该语句中的代码完成运行,该文件将自动关闭。

# Open the file for reading.
with open('my_file.txt', 'r') as infile:

    data = infile.read()  # Read the contents of the file into memory.

现在我们需要专注于将这些数据放入Python 列表中,因为它们是可迭代的、高效的和灵活的。在您的情况下,所需的目标是将文本文件的每一行放入一个单独的元素中。为此,我们将使用splitlines()方法,如下所示:

# Return a list of the lines, breaking at line boundaries.
my_list = data.splitlines()

最终产品:

# Open the file for reading.
with open('my_file.txt', 'r') as infile:

    data = infile.read()  # Read the contents of the file into memory.

# Return a list of the lines, breaking at line boundaries.
my_list = data.splitlines()

测试我们的代码:

  • 文本文件的内容:
     A fost odatã ca-n povesti,
     A fost ca niciodatã,
     Din rude mãri împãrãtesti,
     O prea frumoasã fatã.
  • 出于测试目的打印语句:
    print my_list  # Print the list.

    # Print each line in the list.
    for line in my_list:
        print line

    # Print the fourth element in this list.
    print my_list[3]
  • 输出(由于 unicode 字符而看起来不同):
     ['A fost odat\xc3\xa3 ca-n povesti,', 'A fost ca niciodat\xc3\xa3,',
     'Din rude m\xc3\xa3ri \xc3\xaemp\xc3\xa3r\xc3\xa3testi,', 'O prea
     frumoas\xc3\xa3 fat\xc3\xa3.']

     A fost odatã ca-n povesti, A fost ca niciodatã, Din rude mãri
     împãrãtesti, O prea frumoasã fatã.

     O prea frumoasã fatã.
于 2014-12-20T18:31:22.213 回答
37

在 Python 3.4 中引入,pathlib具有从文件中读取文本的非常方便的方法,如下所示:

from pathlib import Path
p = Path('my_text_file')
lines = p.read_text().splitlines()

(该splitlines调用将其从包含文件全部内容的字符串转换为文件中的行列表)。

pathlib有很多方便的便利。read_text简洁明了,您不必担心打开和关闭文件。如果您需要对文件做的所有事情都是一口气读完,那么这是一个不错的选择。

于 2018-04-30T17:41:37.500 回答
30

这是对文件使用列表推导的另一种选择;

lines = [line.rstrip() for line in open('file.txt')]

这应该是更有效的方式,因为大部分工作都是在 Python 解释器中完成的。

于 2014-05-27T12:21:01.037 回答
29
f = open("your_file.txt",'r')
out = f.readlines() # will append in the list out

现在变量 out 是您想要的列表(数组)。你可以这样做:

for line in out:
    print (line)

或者:

for line in f:
    print (line)

你会得到同样的结果。

于 2014-01-12T10:58:04.890 回答
27

使用 Python 2 和 Python 3 读写文本文件;它适用于 Unicode

#!/usr/bin/env python3
# -*- coding: utf-8 -*-

# Define data
lines = ['     A first string  ',
         'A Unicode sample: €',
         'German: äöüß']

# Write text file
with open('file.txt', 'w') as fp:
    fp.write('\n'.join(lines))

# Read text file
with open('file.txt', 'r') as fp:
    read_lines = fp.readlines()
    read_lines = [line.rstrip('\n') for line in read_lines]

print(lines == read_lines)

注意事项:

  • with是所谓的上下文管理器。它确保打开的文件再次关闭。
  • 这里的所有解决方案都只会产生.strip().rstrip()无法重现,lines因为它们也会剥离空白。

常见文件结尾

.txt

更高级的文件写入/读取

对于您的应用程序,以下内容可能很重要:

  • 其他编程语言的支持
  • 读/写性能
  • 紧凑性(文件大小)

另见:数据序列化格式的比较

如果您正在寻找一种制作配置文件的方法,您可能需要阅读我的简短文章Python 中的配置文件

于 2018-01-16T19:42:10.790 回答
25

如果您想从命令行或标准输入读取文件,也可以使用该fileinput模块:

# reader.py
import fileinput

content = []
for line in fileinput.input():
    content.append(line.strip())

fileinput.close()

像这样将文件传递给它:

$ python reader.py textfile.txt 

在这里阅读更多:http: //docs.python.org/2/library/fileinput.html

于 2013-11-22T14:57:48.097 回答
25

另一个选项是numpy.genfromtxt,例如:

import numpy as np
data = np.genfromtxt("yourfile.dat",delimiter="\n")

这将创建data一个 NumPy 数组,其中的行数与文件中的行数一样多。

于 2013-06-18T10:17:33.377 回答
20

最简单的方法

一个简单的方法是:

  1. 将整个文件作为字符串读取
  2. 逐行拆分字符串

在一行中,这将给出:

lines = open('C:/path/file.txt').read().splitlines()

但是,这是一种非常低效的方式,因为这会将 2 个版本的内容存储在内存中(对于小文件来说可能不是大问题,但仍然如此)。[感谢马克艾默里]。

有2个更简单的方法:

  1. 使用文件作为迭代器
lines = list(open('C:/path/file.txt'))
# ... or if you want to have a list without EOL characters
lines = [l.rstrip() for l in open('C:/path/file.txt')]
  1. 如果您使用的是 Python 3.4 或更高版本,最好使用pathlib为您的文件创建一个路径,以便您可以将其用于程序中的其他操作:
from pathlib import Path
file_path = Path("C:/path/file.txt") 
lines = file_path.read_text().split_lines()
# ... or ... 
lines = [l.rstrip() for l in file_path.open()]
于 2015-02-06T03:34:48.297 回答
15

只需使用 splitlines() 函数。这是一个例子。

inp = "file.txt"
data = open(inp)
dat = data.read()
lst = dat.splitlines()
print lst
# print(lst) # for python 3

在输出中,您将获得行列表。

于 2016-09-09T09:13:08.487 回答
11

如果你想面对一个非常大/巨大的文件并且想要更快地读取(想象你正在参加 Topcoder/Hackerrank 编码比赛),你可能会一次将一大块行读入内存缓冲区,而不是只需在文件级别逐行迭代。

buffersize = 2**16
with open(path) as f: 
    while True:
        lines_buffer = f.readlines(buffersize)
        if not lines_buffer:
            break
        for line in lines_buffer:
            process(line)
于 2017-03-11T08:49:01.390 回答
7

具有一些额外好处的最简单方法是:

lines = list(open('filename'))

或者

lines = tuple(open('filename'))

或者

lines = set(open('filename'))

在 的情况下set,我们必须记住,我们没有保留行顺序并删除重复的行。

下面我添加了来自@MarkAmery的重要补充:

由于您没有调用.close文件对象,也没有使用with语句,因此在某些Python实现中,文件可能不会在读取后关闭,并且您的进程将泄漏打开的文件句柄

CPython(大多数人使用的普通Python实现)中,这不是问题,因为文件对象将立即被垃圾收集,这将关闭文件,但通常认为最好的做法是执行以下操作:

with open('filename') as f: lines = list(f) 

以确保无论您使用什么Python实现,文件都会被关闭。

于 2019-03-14T14:28:53.423 回答
4

如果文档中也有空行,我喜欢在内容中读取并传递它filter以防止出现空字符串元素

with open(myFile, "r") as f:
    excludeFileContent = list(filter(None, f.read().splitlines()))
于 2019-01-16T21:30:43.063 回答
4

用这个:

import pandas as pd
data = pd.read_csv(filename) # You can also add parameters such as header, sep, etc.
array = data.values

data是一种数据框类型,并使用值来获取 ndarray。您还可以使用 获取列表array.tolist()

于 2016-03-30T15:50:32.263 回答
4

大纲和总结

使用filename,处理来自Path(filename)对象的文件,或直接使用open(filename) as f,执行以下操作之一:

  • list(fileinput.input(filename))
  • 使用with path.open() as f,调用f.readlines()
  • list(f)
  • path.read_text().splitlines()
  • path.read_text().splitlines(keepends=True)
  • 一次遍历fileinput.inputorflist.append每一行
  • 传递f给绑定list.extend方法
  • f在列表理解中使用

我在下面解释每个用例。

在 Python 中,如何逐行读取文件?

这是一个很好的问题。首先,让我们创建一些示例数据:

from pathlib import Path
Path('filename').write_text('foo\nbar\nbaz')

文件对象是惰性迭代器,因此只需对其进行迭代。

filename = 'filename'
with open(filename) as f:
    for line in f:
        line # do something with the line

或者,如果您有多个文件,请使用fileinput.input另一个惰性迭代器。只有一个文件:

import fileinput

for line in fileinput.input(filename): 
    line # process the line

或者对于多个文件,将文件名列表传递给它:

for line in fileinput.input([filename]*2): 
    line # process the line

同样,f以上fileinput.input两者都是/返回惰性迭代器。您只能使用一次迭代器,因此为了提供功能代码同时避免冗长,我将使用稍微简洁的fileinput.input(filename)where apropos from here。

在 Python 中,如何将文件逐行读取到列表中?

啊,但你出于某种原因想要它在列表中?如果可能的话,我会避免这种情况。但是,如果您坚持...只需将结果传递fileinput.input(filename)list

list(fileinput.input(filename))

另一个直接的答案是 call f.readlines,它返回文件的内容(最多可选hint字符数,因此您可以通过这种方式将其分解为多个列表)。

您可以通过两种方式访问​​此文件对象。一种方法是将文件名传递给open内置函数:

filename = 'filename'

with open(filename) as f:
    f.readlines()

或使用pathlib模块中的新 Path 对象(我已经非常喜欢,并将从这里开始使用):

from pathlib import Path

path = Path(filename)

with path.open() as f:
    f.readlines()

list还将使用文件迭代器并返回一个列表 - 也是一个非常直接的方法:

with path.open() as f:
    list(f)

如果您不介意在拆分之前将整个文本作为单个字符串读取到内存中,则可以将其作为一个单行器与Path对象和splitlines()字符串方法一起执行。默认情况下,splitlines删除换行符:

path.read_text().splitlines()

如果要保留换行符,请通过keepends=True

path.read_text().splitlines(keepends=True)

我想逐行读取文件并将每一行附加到列表的末尾。

现在要求这个有点傻,因为我们已经用几种方法轻松地展示了最终结果。但是您可能需要在制作列表时对行进行过滤或操作,所以让我们来满足这个要求。

Usinglist.append将允许您在附加之前对每一行进行过滤或操作:

line_list = []
for line in fileinput.input(filename):
    line_list.append(line)

line_list

如果您有一个预先存在的列表,则使用list.extend会更直接,并且可能有用:

line_list = []
line_list.extend(fileinput.input(filename))
line_list

或者更惯用的说法,我们可以改为使用列表推导,并在需要时在其中映射和过滤:

[line for line in fileinput.input(filename)]

或者更直接,要闭环,直接传给list就可以新建一个list,不用对行进行操作:

list(fileinput.input(filename))

结论

您已经看到了许多将文件中的行放入列表的方法,但我建议您避免将大量数据具体化到列表中,而是尽可能使用 Python 的惰性迭代来处理数据。

也就是说,喜欢fileinput.inputwith path.open() as f

于 2018-05-16T20:17:51.693 回答
2

你也可以在 NumPy 中使用 loadtxt 命令。这检查的条件比 genfromtxt 少,因此它可能更快。

import numpy
data = numpy.loadtxt(filename, delimiter="\n")
于 2015-07-20T17:33:03.587 回答
2

我会尝试以下提到的方法之一。我使用的示例文件名为dummy.txt. 您可以在此处找到该文件。我认为该文件与代码位于同一目录中(您可以更改fpath以包含正确的文件名和文件夹路径。)

在下面提到的两个示例中,您想要的列表由 给出lst

1.> 第一种方法

fpath = 'dummy.txt'
with open(fpath, "r") as f: lst = [line.rstrip('\n \t') for line in f]

print lst
>>>['THIS IS LINE1.', 'THIS IS LINE2.', 'THIS IS LINE3.', 'THIS IS LINE4.']

2.>第二种方法中,可以使用Python 标准库中的csv.reader模块:

import csv
fpath = 'dummy.txt'
with open(fpath) as csv_file:
    csv_reader = csv.reader(csv_file, delimiter='   ')
    lst = [row[0] for row in csv_reader] 

print lst
>>>['THIS IS LINE1.', 'THIS IS LINE2.', 'THIS IS LINE3.', 'THIS IS LINE4.']

您可以使用这两种方法中的任何一种。两种方法的创建时间lst几乎相等。

于 2018-12-19T01:47:12.093 回答
2

我喜欢使用以下内容。立即阅读台词。

contents = []
for line in open(filepath, 'r').readlines():
    contents.append(line.strip())

或使用列表理解:

contents = [line.strip() for line in open(filepath, 'r').readlines()]
于 2018-03-29T10:30:32.120 回答
2

这是我用来简化文件 I/O的 Python(3) 辅助库类:

import os

# handle files using a callback method, prevents repetition
def _FileIO__file_handler(file_path, mode, callback = lambda f: None):
  f = open(file_path, mode)
  try:
    return callback(f)
  except Exception as e:
    raise IOError("Failed to %s file" % ["write to", "read from"][mode.lower() in "r rb r+".split(" ")])
  finally:
    f.close()


class FileIO:
  # return the contents of a file
  def read(file_path, mode = "r"):
    return __file_handler(file_path, mode, lambda rf: rf.read())

  # get the lines of a file
  def lines(file_path, mode = "r", filter_fn = lambda line: len(line) > 0):
    return [line for line in FileIO.read(file_path, mode).strip().split("\n") if filter_fn(line)]

  # create or update a file (NOTE: can also be used to replace a file's original content)
  def write(file_path, new_content, mode = "w"):
    return __file_handler(file_path, mode, lambda wf: wf.write(new_content))

  # delete a file (if it exists)
  def delete(file_path):
    return os.remove() if os.path.isfile(file_path) else None

然后,您将使用该FileIO.lines函数,如下所示:

file_ext_lines = FileIO.lines("./path/to/file.ext"):
for i, line in enumerate(file_ext_lines):
  print("Line {}: {}".format(i + 1, line))

请记住,mode"r"默认情况下)和filter_fn(默认情况下检查空行)参数是可选的。

您甚至可以删除read,writedelete方法而只保留FileIO.lines, 甚至将其变成一个单独的方法,称为read_lines.

于 2019-04-20T14:44:31.380 回答
1

命令行版本

#!/bin/python3
import os
import sys
abspath = os.path.abspath(__file__)
dname = os.path.dirname(abspath)
filename = dname + sys.argv[1]
arr = open(filename).read().split("\n") 
print(arr)

运行:

python3 somefile.py input_file_name.txt
于 2017-08-29T23:53:59.623 回答