我已经编写了一些代码来从“pdf”文件的特定页面读取数据并使用 python 将其写入 csv 文件。它只是部分地完成了它的工作。但是,在将数据写入 csv 文件时,它会将这些数据写入单行而不是常规模式。我应该如何修改我的脚本以达到目的?提前致谢。
这是我迄今为止尝试过的:
import csv
from PyPDF2 import PdfFileReader
outfile = open("conversion.csv",'w', newline='')
writer = csv.writer(outfile)
infile = open('some.pdf', 'rb')
reader = PdfFileReader(infile)
contents = reader.getPage(7).extractText().split('\n')
writer.writerow(contents)
print(contents)
infile.close()
pdf中的数据如下:
Creating a PivotTable Report 162
PivotCaches 165
PivotTables Collection 165
PivotFields 166
CalculatedFields 170
我在 csv 输出中获取数据,例如:
Creating a PivotTable Report 162 PivotCaches 165 PivotTables Collection 165 PivotFields 166 CalculatedFields 170