我正在我的手机上写这个,所以一个完整的代码示例目前是不可能的,但我需要一些帮助。
我正在从压缩的 infile 中解析一组 .csv 文件,从每个文件中提取特定列,使用所选列生成新的 .csv,然后将新的数据帧导出到压缩的 outfile。
我通过一系列循环来做到这一点,但解析过程的成功率不能超过 78%,而结合压缩过程的解析成功率不能超过 73%。
zipfile.ZipFile 或 pandas.to_csv... 我已经尝试了两个星期,我终于崩溃寻求帮助。
现在简短的代码片段:
导出功能:
def export(new_filename):
os.chdir([import_file location])
try:
with zipfile.ZipFile(outfile_name,'a',zipfile=ZIP_DEFLATED, allowZip64=true) as outfile:
try:
outfile.write(new_filename)
#random errors at runtime saying the writing handle is still open... Not sure why.
except:
#print statement to alert of failure at this step. I have tried NameError
#and ValueError exceptions, but they don't help.
except:
#another statement to alert failure
熊猫功能:
def infile_parser(filename, new_filename):
#excluding code beyond making the dataframe and file generation
df = pd.dataframe(data,columns=useful_columns)
df.to_csv(new_filename,index=false)
先感谢您。如果需要,我可以添加更多上下文。