我将每天在一个简单的数字海洋实例(1 个 vCPU,1GB 内存)上运行 camelot,以从 +-150 页的 PDF 中提取信息并存储在数据库中。什么是最好的做法:
a) 一次阅读所有页面camelot.read_pdf('file.pdf', pages='all', flavor='stream')
?
b) 逐页阅读?
for page in range(150):
camelot.read_pdf('file.pdf', pages=f'{page}', flavor='stream')
谢谢