问题标签 [tabulizer]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
0 回答
19 浏览

rjava - 运行代码几次后出现“超出 GC 开销限制”错误

我正在尝试使用tabulizer和从 pdf 文件中提取表格rJava。该代码在几页上运行良好,但在某个点之后它开始显示此错误。我对 R 比较陌生,并且被困在这里。

0 投票
1 回答
192 浏览

java - 使用R中的Tabulizer从pdf中提取表格时如何解决Java错误

我正在尝试pdf使用. 我运行以下行:tabulizerR

但是我不断收到此错误:

.jcall("RJavaTools", "Ljava/lang/Object;", "invokeMethod", cl, : java.lang.IllegalAccessException: class RJavaTools cannot access a member of class java.util.ArrayList$Itr (在模块 java .base) 带有修饰符“public”

我能够从中提取元数据pdf,所以我很确定安装tabulizer包没有问题,但更多的是java问题,我不是很有经验。

0 投票
0 回答
21 浏览

r - 我如何在 R 查看器中应用缩放

我正在尝试使用此代码:

要从 PDF 中提取表格,但 PDF 在 R 查看器中显得很小,如何在查看器上应用缩放以更轻松地从 PDF 页面中选择表格?

0 投票
0 回答
160 浏览

r - 从R中的PDF中提取表格

我是 R 新手,我想从 PDF 中提取数据。在某些情况下,我按照教程设置 rJava,然后尝试运行代码:

当我这样做时,我收到以下错误:

这可能是什么原因造成的?这是一个 3 页 PDF,第 2 页上的表格带有标题

请帮忙

0 投票
0 回答
124 浏览

java - 在 jupyter-notebook 但不在控制台中运行时,extract_tables 函数出错

在 VSCode 的 jupyter-notebook 中运行前面的 R 命令会输出错误:

错误:.jcall 中的错误(“RJavaTools”、“Ljava/lang/Object;”、“invokeMethod”、cl、:java.lang.IllegalAccessException:RJavaTools 类无法访问 java.util.ArrayList$Itr 类的成员(在.jcall("RJavaTools", "Ljava/lang/Object;", "invokeMethod", cl, : java.lang.IllegalAccessException: class RJavaTools cannot access a member of class java .util.ArrayList$Itr(在模块 java.base 中)带有修饰符“public” Traceback:

  1. extract_tables(f, output = "data.frame")
  2. 猜测迭代器$hasNext()
  3. .jrcall(x, 名字, ...)
  4. .jcall("RJavaTools", "Ljava/lang/Object;", "invokeMethod", cl, ..jcast(if (inherits(o, "jobjRef") || inherits(o, "jarrayRef")) o else cl , . "java/lang/Object"), .jnew("java/lang/String", method), . j_p, j_pc, use.true.class = TRUE, evalString = simple, . evalArray = FALSE)
  5. .jcheck(沉默=假)

但不是在 R 控制台中运行时。

提前致谢。

*我正在运行Java 11(我也尝试了17版本,但问题仍然存在)

0 投票
1 回答
546 浏览

r - 在 R 中安装 tabulizer 包时遇到问题

我有一个使用 tabulizer 的脚本,但必须清理我的硬盘驱动器并重新安装 R,现在我似乎什至无法下载和访问 tabulizer 库。我现在使用的是 R 版本 4.1.2 64 位,我想也许我需要使用早期版本的 R ???这是我尝试安装 tabulizer 时收到的错误消息。

我试图去 Cran ( https://cran.r-project.org/src/contrib/Archive/tabulizer/ ) 并下载库并将其解压缩到我的目录,但后来我又遇到了错误。有任何想法吗?谢谢。

0 投票
0 回答
40 浏览

ssl - extract_tables 函数状态为“SSL 连接错误”错误

我在Github中提出了类似的问题。但是,由于我无法收到回复,我只是想在这里发布它,以防有人可以在这个问题上帮助我。事先感谢您的帮助。

在过去的两天里,我正在尝试安装 tabulizer 包,以便我可以从在线 pdf 中检索一些信息并对这些数据进行一些分析。我设法在我的 R Studio 中上传了包,但是当我运行这行代码时

我收到以下错误

为了解决这个问题,我尝试了几个解决方案。基于 Stack 的这个解决方案,我从 http 中删除了“s”,但错误仍然显示“https”,我无法理解。

为了检查这种情况是否是本网站独有的,我也在另一个网站上通过以下代码进行了类似的尝试;

为了检查这种情况是否是本网站独有的,我也在另一个网站上通过以下代码进行了类似的尝试;

这时,我收到了这个错误;

当我查看一些解决方案时,我看到了 this这个。据我了解,此链接上的解决方案主要是关于 Java 的早期版本。但是,我最近在我的 Mac 上下载了 Java,它的版本是

java version "1.8.0_311"

基于此链接中的解决方案,我还运行以下代码

哪个游戏我这个结果

因此,我不认为我的问题是由于以前的 Java 版本而发生的。我还附上了我的会话信息。如果你在这个问题上帮助我,我会很高兴的。先感谢您。

## 这是我的会话信息

0 投票
0 回答
22 浏览

r - 在 R 中使用制表符精确表

我可以从https://www.nicd.ac.za/diseases-az-index/disease-index-covid-19/surveillance-reports/daily-hospital-surveillance-datcov-report/的许多文件中提取表格。但是,对于许多 PDF,我不能。这是一个这样的案例以及我的玩具代码。

使用它我得到的区域如下

但是,在将这个区域提供给 tabulizer 包的 extract_tables 函数时,我没有得到表格。

我还尝试了以下方法来提取表格,但仍然没有运气!

我在这里想念什么。请指教。

0 投票
0 回答
151 浏览

java - Trying to resolve Java issue when running Tabulizer in R

I am trying to extract tables from pdfs in R using tabulizer, and keep getting this error when I use extract_tables.

Error in .jcall("RJavaTools", "Ljava/lang/Object;", "invokeMethod", cl, : java.lang.IllegalAccessException: class RJavaTools cannot access a member of class java.util.ArrayList$Itr (in module java.base) with modifiers "public"

I have seen this question asked before and am aware that it is likely a dependency issue, but am unsure about how to fix that. I installed Maven and that hasn't seemed to work.

0 投票
0 回答
22 浏览

r - Error when extracting pdf data using tabulizer

When I want to extract tables from multiple PDF files with the extract_tables() function from the tabulizer library I get the following error :

When I use the function for one PDF file it works fine, but when I use several it goes wrong.

Does anyone know what error message this is and how I can fix it?