将此PDF保存到本地目录为“MIX_AESR_2562.pdf”。我想在 p646 和 p647 上刮桌子。这是脚本:
import tabula
pdf_file = 'MIX_AESR_2562.pdf'
table = tabula.read_pdf(pdf_file, pages=647, multiple_tables=False)
print(table[0])
奇怪的结果
Pat\rSar\rSin Unnamed: 1 um\rbur\rB Th\rri ni Unnamed: 5 Unnamed: 6 Unnamed: 7 Unnamed: 8 Unnamed: 9 Unnamed: 10 Unnamed: 11 Unnamed: 12 \
0 NaN ZO\rKa\rNa NaN E:\rcha\rhon 5\rabu\rPat i\rom NaN NaN NaN NaN NaN NaN NaN
1 Ph\rPra\rRat NaN tch\rhu\rha buri\rp K\ruri iri NaN ha NaN NaN NaN NaN NaN NaN
2 NaN Sa\rSa\rSu NaN ut\rut\rhan ak\ron\rBur on\rkhr NaN m NaN NaN NaN NaN NaN
3 Ch\rCh NaN cho\rnth ng\rburi ao NaN NaN NaN NaN NaN NaN NaN NaN
4 NaN Pra\rRa\rSa NaN hin\rong\rae Bur NaN NaN NaN NaN NaN NaN NaN NaN
5 NaN Sa\rTra\rNo NaN ut\rth rak\rast n\rRe NaN io NaN NaN NaN NaN NaN
6 NaN ZO\rKal\rKh NaN E:\rsin\rn K 7\ren NaN NaN NaN NaN NaN NaN NaN NaN
7 NaN Ma\rRoi\rZO NaN a\rEt\rE: arak\r8 a NaN NaN NaN NaN NaN NaN NaN
第 646 页的结果看起来不错,但 p647 的结果完全没有意义。我从哪里开始调查?