我正在使用表格 python 将 pdf 文件转换为表格的项目。在扫描表格时检测到这样的表格,但是表格这样的列如下图,而表格的实际图像如下图_2
是否有任何方法使用 python 将单列分成单独的列,如第二张图片。
您需要将str.split与 expand=True 一起使用。
例子:
>>> import pandas as pd
>>> df = pd.DataFrame([["Purchase Balance"],["138 303"]])
>>> df
0
0 Purchase Balance
1 138 303
>>> df[0].str.split(" ", expand=True)
0 1
0 Purchase Balance
1 138 303