问题标签 [tabulizer]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
0 回答
117 浏览

r - 导入包“tabulizer”时出错

当我导入包“tabulizer”时出现此错误(见图),有人可以帮忙吗?

制表错误

0 投票
0 回答
61 浏览

r - extract_table 函数导致 R 崩溃

我只是在使用:

extract_tables('/Users/ben/OneDrive/Utah Local Governments Trust/Underwriting - Documents/Data Analysis/Emod Calculation/Expected Loss Rates, D-Ratio, Etc.pdf')

加载后:

library(tabulizer)

library(tabulizerjars)

它说它需要使用 Java SE 6 来打开 Rstudio,但我可以在运行函数之前用最新的 java 打开它。

0 投票
1 回答
34 浏览

r - 根据标题抓取 PDF 表格

我正在尝试从 31 个 pdf 中分别提取一个表。表格的标题都以相同的方式开始,但结尾因地区而异。

一份文件的标题是“表 13.1:2011/12 农业年度按地区、农村和城市居民分列的从事农业的家庭总数;阿鲁沙地区,2012 年人口普查”。另一个是“表 13.1:2011/12 农业年度按地区、农村和城市居民分列的从事农业的家庭总数;多多马地区,2012 年人口普查”。

我使用 tabulizer 根据我需要的特定文本行手动抓取第一个表,但考虑到类似的命名约定,我希望自动化这个过程。

0 投票
0 回答
112 浏览

r - 错误:“tabulizer”的包或命名空间加载失败

我使用这段代码将 web pdf 转换为 csv 文件,到目前为止效果很好:

我今天收到这些错误消息:

有人可以帮我吗?

0 投票
1 回答
306 浏览

r - 在库中找不到 rJava“EXTPR_PTR”过程入口点

我正在尝试安装 rJava 以使用包 tabulizer。到目前为止,我的步骤是install.packages("rJava")运行,运行Sys.setenv(JAVA_HOME="C:/Program Files/Java/jdk-15.0.1"),然后运行library(rJava)。运行最后一个命令时,我首先会弹出一个显示EXTPTR_PTR Entry Point for procedure not found(基于我希望的翻译),然后在控制台中:

我确保我拥有 Java 的 JRE 和 JDK 版本的最新版本,并且它们和 R 都是 64 位版本。我还尝试将 Java_Home路径指向其中任何一个,以及 just ../Java,它们都返回相同的错误。关于它是什么错误的任何线索?所有帮助表示赞赏!

0 投票
1 回答
43 浏览

r - 有什么方法可以将字符编码更改为等效的英文 IN R?

在 R 中,我使用 Tabulizer 库从 Pdf 表中提取数据,名称为尼泊尔语,提取后我获取此表 [1]:https ://i.stack.imgur.com/Ltpqv.png

但现在我希望第 2 列的名称更改为英文等效项

有没有办法在 R 中做到这一点

我写的 R 代码是

0 投票
0 回答
28 浏览

r - 如何在R中垂直提取表格

下面的代码从pdf中提取表格并水平放入CSV,
有人可以帮我如何将每个页面的表格垂直提取到csv中吗?

0 投票
1 回答
76 浏览

r - 使用嵌套信息在 R 中抓取 PDF

我试图在 R 中同时使用pdftools::pdf_text和来抓取一个相当困难的 PDF tabulizer::extract_tables但是,在我的情况下,根据PDF的性质,这些似乎都没有太大帮助。PDF 包含“嵌套”信息,如图所示。

解决这个问题的最佳方法是什么?stringr::str_split_fixed使用with 用空格分割n=3给了我矩阵,但似乎很难创建一个正则表达式来检测每列中我想要的信息(仅在描述和事件日期/时间之后)。

0 投票
1 回答
47 浏览

r - 如何根据 R 编程中的下一列重命名列标题

如何重命名具有“X 或 X.1 或 X.3”值的列标题,但它应该使用下一列的标题引用和重命名。

代码:

实际输出:

预期输出:

0 投票
2 回答
32 浏览

r - 如果标签名称在R编程中以“G”开头,如何删除列标签

如果标签名称以“G”开头,如何删除列标签

代码:

实际输出:

预期输出:

另外请向我建议从 PDF 中提取数据表的任何其他 R 包(pdftools 和 tabulizer 除外)