我有一个 PDF 文件,它有这样的表格(只是比喻)
American | Asian | African | European | Middle
Animals | | Animals | pottery | East
| tree | Flying | fragile |
2010 2 6 19 12 14
2011 3 5 9 9 20
2012 9 2 14 0 1
当我使用 PDFtools 或 tabulizer 包提取此表时,这些包会逐行提取此表。
所以第一行的结果是
American Asian African European Middle \r\n Animals Animals pottery East \r\n tree Flying fragile \r\n
但我想要的是正确提取这个
American Animals Asian tree African Animals Flying European pottery fragile Middle East
有什么方法可以提取正确吗?
也偶然我注意到,当我拖动并复制然后将此表粘贴到 Window 记事本时,记事本会像这样神奇地读取它;
American Animals Asian tree African Animals Flying European pottery fragile Middle East
所以我想制作一些代码,自动将表格粘贴到记事本,然后将其重新复制到 R,因此直接将其放入某个变量中。我也想知道如何在 R 编码中实现这一点。