0

我正在我的手机上写这个,所以一个完整的代码示例目前是不可能的,但我需要一些帮助。

我正在从压缩的 infile 中解析一组 .csv 文件,从每个文件中提取特定列,使用所选列生成新的 .csv,然后将新的数据帧导出到压缩的 outfile。

我通过一系列循环来做到这一点,但解析过程的成功率不能超过 78%,而结合压缩过程的解析成功率不能超过 73%。

zipfile.ZipFile 或 pandas.to_csv... 我已经尝试了两个星期,我终于崩溃寻求帮助。

现在简短的代码片段:

导出功能:

 def export(new_filename):

   os.chdir([import_file location])
   try:
      with zipfile.ZipFile(outfile_name,'a',zipfile=ZIP_DEFLATED, allowZip64=true) as outfile:
         try:
           outfile.write(new_filename)
           #random errors at runtime saying the writing handle is still open... Not sure why. 
         except:
           #print statement to alert of failure at this step. I have tried NameError 
           #and ValueError exceptions, but they don't help. 
   except:
      #another statement to alert failure

熊猫功能:

 def infile_parser(filename, new_filename):

     #excluding code beyond making the dataframe and file generation
     df = pd.dataframe(data,columns=useful_columns)
     df.to_csv(new_filename,index=false)

先感谢您。如果需要,我可以添加更多上下文。

4

0 回答 0