问题标签 [tabulizer]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - extract_table 函数导致 R 崩溃
我只是在使用:
extract_tables('/Users/ben/OneDrive/Utah Local Governments Trust/Underwriting - Documents/Data Analysis/Emod Calculation/Expected Loss Rates, D-Ratio, Etc.pdf')
加载后:
library(tabulizer)
library(tabulizerjars)
它说它需要使用 Java SE 6 来打开 Rstudio,但我可以在运行函数之前用最新的 java 打开它。
r - 根据标题抓取 PDF 表格
我正在尝试从 31 个 pdf 中分别提取一个表。表格的标题都以相同的方式开始,但结尾因地区而异。
一份文件的标题是“表 13.1:2011/12 农业年度按地区、农村和城市居民分列的从事农业的家庭总数;阿鲁沙地区,2012 年人口普查”。另一个是“表 13.1:2011/12 农业年度按地区、农村和城市居民分列的从事农业的家庭总数;多多马地区,2012 年人口普查”。
我使用 tabulizer 根据我需要的特定文本行手动抓取第一个表,但考虑到类似的命名约定,我希望自动化这个过程。
r - 错误:“tabulizer”的包或命名空间加载失败
我使用这段代码将 web pdf 转换为 csv 文件,到目前为止效果很好:
我今天收到这些错误消息:
有人可以帮我吗?
r - 在库中找不到 rJava“EXTPR_PTR”过程入口点
我正在尝试安装 rJava 以使用包 tabulizer。到目前为止,我的步骤是install.packages("rJava")
运行,运行Sys.setenv(JAVA_HOME="C:/Program Files/Java/jdk-15.0.1")
,然后运行library(rJava)
。运行最后一个命令时,我首先会弹出一个显示EXTPTR_PTR Entry Point for procedure not found
(基于我希望的翻译),然后在控制台中:
我确保我拥有 Java 的 JRE 和 JDK 版本的最新版本,并且它们和 R 都是 64 位版本。我还尝试将 Java_Home
路径指向其中任何一个,以及 just ../Java
,它们都返回相同的错误。关于它是什么错误的任何线索?所有帮助表示赞赏!
r - 有什么方法可以将字符编码更改为等效的英文 IN R?
在 R 中,我使用 Tabulizer 库从 Pdf 表中提取数据,名称为尼泊尔语,提取后我获取此表 [1]:https ://i.stack.imgur.com/Ltpqv.png
但现在我希望第 2 列的名称更改为英文等效项
有没有办法在 R 中做到这一点
我写的 R 代码是
r - 如何在R中垂直提取表格
下面的代码从pdf中提取表格并水平放入CSV,
有人可以帮我如何将每个页面的表格垂直提取到csv中吗?
r - 使用嵌套信息在 R 中抓取 PDF
我试图在 R 中同时使用pdftools::pdf_text
和来抓取一个相当困难的 PDF tabulizer::extract_tables
。但是,在我的情况下,根据PDF的性质,这些似乎都没有太大帮助。PDF 包含“嵌套”信息,如图所示。
解决这个问题的最佳方法是什么?stringr::str_split_fixed
使用with 用空格分割n=3
给了我矩阵,但似乎很难创建一个正则表达式来检测每列中我想要的信息(仅在描述和事件日期/时间之后)。
r - 如何根据 R 编程中的下一列重命名列标题
如何重命名具有“X 或 X.1 或 X.3”值的列标题,但它应该使用下一列的标题引用和重命名。
代码:
实际输出:
预期输出:
r - 如果标签名称在R编程中以“G”开头,如何删除列标签
如果标签名称以“G”开头,如何删除列标签
代码:
实际输出:
预期输出:
另外请向我建议从 PDF 中提取数据表的任何其他 R 包(pdftools 和 tabulizer 除外)