0

将此PDF保存到本地目录为“MIX_AESR_2562.pdf”。我想在 p646 和 p647 上刮桌子。这是脚本:

import tabula

pdf_file = 'MIX_AESR_2562.pdf'
table = tabula.read_pdf(pdf_file, pages=647, multiple_tables=False)

print(table[0])

奇怪的结果

   Pat\rSar\rSin   Unnamed: 1   um\rbur\rB          Th\rri           ni Unnamed: 5 Unnamed: 6 Unnamed: 7  Unnamed: 8  Unnamed: 9  Unnamed: 10  Unnamed: 11  Unnamed: 12  \
0            NaN   ZO\rKa\rNa          NaN    E:\rcha\rhon  5\rabu\rPat      i\rom        NaN        NaN         NaN         NaN          NaN          NaN          NaN   
1   Ph\rPra\rRat          NaN  tch\rhu\rha  buri\rp K\ruri          iri        NaN         ha        NaN         NaN         NaN          NaN          NaN          NaN   
2            NaN   Sa\rSa\rSu          NaN     ut\rut\rhan  ak\ron\rBur    on\rkhr        NaN          m         NaN         NaN          NaN          NaN          NaN   
3         Ch\rCh          NaN     cho\rnth        ng\rburi           ao        NaN        NaN        NaN         NaN         NaN          NaN          NaN          NaN   
4            NaN  Pra\rRa\rSa          NaN    hin\rong\rae          Bur        NaN        NaN        NaN         NaN         NaN          NaN          NaN          NaN   
5            NaN  Sa\rTra\rNo          NaN          ut\rth     rak\rast      n\rRe        NaN         io         NaN         NaN          NaN          NaN          NaN   
6            NaN  ZO\rKal\rKh          NaN    E:\rsin\rn K        7\ren        NaN        NaN        NaN         NaN         NaN          NaN          NaN          NaN   
7            NaN  Ma\rRoi\rZO          NaN       a\rEt\rE:      arak\r8          a        NaN        NaN         NaN         NaN          NaN          NaN          NaN   

第 646 页的结果看起来不错,但 p647 的结果完全没有意义。我从哪里开始调查?

4

0 回答 0