28

我有一个大的 csv 文件,其中一些行完全是空白的。如何使用 Python 从 csv 中删除所有空白行?

在您提出所有建议之后,这就是我到目前为止所拥有的

import csv

# open input csv for reading
inputCSV = open(r'C:\input.csv', 'rb')

# create output csv for writing
outputCSV = open(r'C:\OUTPUT.csv', 'wb')

# prepare output csv for appending
appendCSV = open(r'C:\OUTPUT.csv', 'ab')

# create reader object
cr = csv.reader(inputCSV, dialect = 'excel')

# create writer object
cw = csv.writer(outputCSV, dialect = 'excel')

# create writer object for append
ca = csv.writer(appendCSV, dialect = 'excel')

# add pre-defined fields
cw.writerow(['FIELD1_','FIELD2_','FIELD3_','FIELD4_'])

# delete existing field names in input CSV
# ???????????????????????????

# loop through input csv, check for blanks, and write all changes to append csv
for row in cr:
    if row or any(row) or any(field.strip() for field in row):
        ca.writerow(row)

# close files
inputCSV.close()
outputCSV.close()
appendCSV.close()

这可以吗还是有更好的方法来做到这一点?

4

11 回答 11

33

使用csv模块:

import csv
...

with open(in_fnam, newline='') as in_file:
    with open(out_fnam, 'w', newline='') as out_file:
        writer = csv.writer(out_file)
        for row in csv.reader(in_file):
            if row:
                writer.writerow(row)

如果您还需要删除所有字段为空的行,请将行更改if row:为:

if any(row):

如果您还想将仅包含空格的字段视为空,您可以将其替换为:

if any(field.strip() for field in row):

请注意,在 Python 2.x 及更早版本中,csv模块需要二进制文件,因此您需要使用 e'b'标志打开文件。在 3.x 中,这样做会导致错误。

于 2010-12-23T18:43:47.990 回答
10

很惊讶这里没有人提到pandas。这是一个可能的解决方案。

import pandas as pd
df = pd.read_csv('input.csv')
df.to_csv('output.csv', index=False)
于 2018-03-29T17:45:52.253 回答
6

使用python从.csv文件中删除空行

    import csv
  ...


 with open('demo004.csv') as input, open('demo005.csv', 'w', newline='') as output:
     writer = csv.writer(output)
     for row in csv.reader(input):
         if any(field.strip() for field in row):
             writer.writerow(row)

谢谢

于 2020-07-24T11:55:33.033 回答
3

您必须打开第二个文件,将所有非空行写入其中,删除原始文件并将第二个文件重命名为原始名称。

编辑:一个真正的空行将像'\ n':

for line in f1.readlines():
    if line.strip() == '':
        continue
    f2.write(line)

包含所有空白字段的行看起来像 ',,,,,\n'。如果您认为这是一个空行:

for line in f1.readlines():
    if ''.join(line.split(',')).strip() == '':
        continue
    f2.write(line)

打开、关闭、删除和重命名文件留给您作为练习。(提示:导入操作系统,帮助(打开),帮助(os.rename),帮助(os.unlink))

EDIT2:Laurence Gonsalves 引起我的注意,一个有效的 csv 文件可以在引用的 csv 字段中嵌入空行,例如1, 'this\n\nis tricky',123.45. 在这种情况下, csv 模块将为您处理这些问题。对不起,劳伦斯,你的回答值得被接受。csv 模块还将解决对像"","",""\n.

于 2010-12-23T18:32:07.140 回答
3

用熊猫做这件事很简单。用 pandas 打开你的 csv 文件:

import pandas as pd
df = pd.read_csv("example.csv")
#checking the number of empty rows in th csv file
print (df.isnull().sum())
#Droping the empty rows
modifiedDF = df.dropna()
#Saving it to the csv file 
modifiedDF.to_csv('modifiedExample.csv',index=False)
于 2019-02-05T12:23:47.457 回答
2

用于从 csv 文件中删除空白行而不创建另一个文件的 python 代码。

def ReadWriteconfig_file(文件):

try:
    file_object = open(file, 'r')
    lines = csv.reader(file_object, delimiter=',', quotechar='"')
    flag = 0
    data=[]
    for line in lines:
        if line == []:
            flag =1
            continue
        else:
            data.append(line)
    file_object.close()
    if flag ==1: #if blank line is present in file
        file_object = open(file, 'w')
        for line in data:
            str1 = ','.join(line)
            file_object.write(str1+"\n")
        file_object.close() 
except Exception,e:
    print e
于 2017-05-10T07:58:26.270 回答
2

这是使用 pandas 删除空白行的解决方案。

 import pandas as pd
 df = pd.read_csv('input.csv')
 df.dropna(axis=0, how='all',inplace=True)
 df.to_csv('output.csv', index=False)
于 2019-12-29T20:39:22.450 回答
1

我需要这样做,但不幸的是,在 CSV 文件的末尾没有写一个空白行,就像这段代码一样(如果你保存-> .csv,这也是 Excel 所做的)。我使用 CSV 模块的(甚至更简单的)代码也是这样做的:

import csv

input = open("M51_csv_proc.csv", 'rb')
output = open("dumpFile.csv", 'wb')
writer = csv.writer(output)
for row in csv.reader(input):
    writer.writerow(row)
input.close()
output.close() 

M51_csv_proc.csv 正好有 125 行;程序总是输出 126 行,最后一行是空白的。

我已经经历了所有这些线程,似乎没有任何东西可以改变这种行为。

于 2019-01-03T11:06:33.970 回答
0

在此脚本中,所有 CR / CRLF 都从 CSV 文件中删除,然后具有如下行:

"My name";mail@mail.com;"This is a comment.
Thanks!"

执行脚本https://github.com/eoconsulting/lr2excelcsv/blob/master/lr2excelcsv.py

结果(Excel CSV 格式):

"My name",mail@mail.com,"This is a comment. Thanks!"
于 2012-09-10T15:37:21.713 回答
0

将 PATH_TO_YOUR_CSV 替换为您的

import pandas as pd

df = pd.read_csv('PATH_TO_YOUR_CSV')
new_df = df.dropna()
df.dropna().to_csv('output.csv', index=False)

或在线:

import pandas as pd

pd.read_csv('data.csv').dropna().to_csv('output.csv', index=False)
于 2021-03-08T12:14:13.847 回答
0

我有同样的问题。

我将 .csv 文件转换为数据帧,然后将数据帧转换回 .csv 文件。

带有空行的初始 .csv 文件是 'csv_file_logger2.csv' 。

所以,我做以下过程

import csv
import pandas as pd
df=pd.read_csv('csv_file_logger2.csv')

df.to_csv('out2.csv',index = False)
于 2021-06-11T10:38:22.230 回答