问题标签 [tabulizer]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
0 回答
216 浏览

r - rJava 和 tabulizer 在 mac Catalina 上不起作用

我已经尝试了一切来尝试加载 rJava,但我失败了。关于如何解决这个问题的任何建议?当我在 R(不是 R studio)中运行 library(rJava) 时,它似乎加载了。

Sys.setenv(JAVA_HOME="/Library/Java/JavaVirtualMachines/jdk-11.0.1.jdk/Contents/Home/")库(tabulizer)错误:'tabulizer'的包或命名空间加载失败:.onLoad在loadNamespace中失败( ) 对于“tabulizerjars”,详细信息:调用:NULL 错误:.onLoad 在 loadNamespace() 中失败,用于“rJava”,详细信息:调用:dyn.load(file, DLLpath = DLLpath, ...) 错误:无法加载共享对象'/Library/Frameworks/R.framework/Versions/3.6/Resources/library/rJava/libs/rJava.so': dlopen(/Library/Frameworks/R.framework/Versions/3.6/Resources/library/rJava/libs/ rJava.so, 6):库未加载:/Library/Java/JavaVirtualMachines/jdk-11.0.1.jdk/Contents/Home/lib/server/libjvm.dylib 引用自:/Library/Frameworks/R.framework/Versions /3.6/Resources/library/rJava/libs/rJava.so 原因:找不到图片

0 投票
0 回答
75 浏览

r - 有什么方法可以在 R 中垂直使用 extract_text 吗?

我正在尝试从用韩语编写的 pdf 文件中提取表格文本。我使用名为 tabulizer 的库来提取文本。

所以我的代码是

但问题是 pdf 文件中的表格,该模式不适合我。我想垂直提取数据,但是,extract_text 函数使字符串水平

以下是 extract_text 发生的结果:

更具体地说,我附上了捕获图像。

在此处输入图像描述

同样,我要提取的是垂直的(红色圆圈)但是 extract_text 水平组织它(蓝色圆圈)

另外,如果您知道如何组织文本,{cat(e, sep="\n")}请发表评论,因为使用 cat 函数,我不能将结果包含在变量中,它会自动给我输出,我别无选择包含这些值..但我希望事情有条理和'任何时候我想需要一些信息,我都会去容器变量,然后获取信息..' <<这就是我需要的

0 投票
0 回答
526 浏览

r - 有什么方法可以用 R 提取 pdf 表格整齐吗?

我需要一个自动代码来提取 R 中的 pdf 表。

所以我搜索了网站,找到了 tabulizer 包。

我用

我尝试了每种方法类型,但结果并不整洁。

有些列是混合的,有很多空白,你可以看到图像文件。

我想我会直接修改数据。但目的是使其自动化。所以需要通用方法。而且每个pdf文件都没有组织。有些表非常整齐,每条相关行都完美匹配,但其他表则不然。正如您在我的结果图像中看到的那样,在第 4 列中,数字混合在同一列中。其他列,数字是一一匹配的,我的意思是我想自动使列像pdf中的表格一样整齐。

是否有任何包装或某种方法可以使提取的表格整洁?

我的代码结果

PDF格式的表格

0 投票
0 回答
28 浏览

r - 当表格同时具有单元格值和颜色代码时,如何使用制表器从 PDF 文件中提取表格?

关于如何使用制表器从 PDF 文件中提取表格,我有一个令人费解的问题。

这是桌子。您会注意到每个单元格都有一个值,但它也是彩色编码的。 https://anhd.org/wp-content/uploads/2016/11/20161106_anhd_ed_poster.pdf

我一直在使用 R 代码方法:> https://medium.com/@ketanrd.009/how-to-extract-pdf-tables-in-r-e994c0fe4e28

你能给我任何关于如何提取细胞计数和颜色编码风险级别的帮助吗?

谢谢你。

0 投票
1 回答
111 浏览

r - 是否有比 R 中的“extract_table”函数更整洁的方法?

我的最终目标是用整洁(干净)的框架来整理桌子。

这是我捕获原始pdf页面的图像文件。(对不起语言,因为我现在要离开韩国了)

pdf 捕获图像

当我在 R 包“tabulizer”中使用“extract_table”函数时,结果是这样的

R 结果捕获

如您所见,没有整洁或干净的框架。因为有很多“”,而且功能分割并用线条制作框架!所以每一行都是分开的。我的意思是,如果您看到 [11,] [12,] [13,] 行,在 pdf 文件中它应该只是包含 (수수료선취-오프라인(A), 0.3500, 0.5100, 0.0300, 0.0100 , 0.9000, -, 0.9000, 1.8500, 0.9000)。然而,在 R 结果中,它被分成三行 [11,] [12,] [13,]。

所以我想解决这个问题,并使结果与 pdf 文件完全相同。

如果你知道任何关于它的答案,请留下任何回复来帮助我。

另外,捕获的图像中没有提到的另一个问题是

如果包中有误读,则合并列或行。例如表中的第一个和第二个数字0.3500,0.5100应该是分开的。但是有时它只合并在一列中,0.35000.5100,就像那样。

我该如何解决?

感谢您的阅读。

++

0 投票
0 回答
198 浏览

r - 有什么方法可以在 R 中使用不同的 extract_table 函数吗?

原始pdf文件

我正在尝试在 tabulizer 包中使用 extract_tables 。

我需要使用 extract_table 函数,就是这段代码。

但是,有一个关键问题。它会自动合并某些列 捕获pdf表格 捕获 R 结果

当您看到两张图片时,您可能会了解情况。第 6 列和第 7 列,在 pdf 表格中的图像被合并。

不是

0.9000 | -

0.6450 | -

0.7470 | -

两列合并为

0.9000-

0.6450-

0.7470-

所以我想找到方法不要像这样制作表格,这也是一般的方法。

因此,我尝试将另一个组件放在这样的函数中。

因此,如果您知道我应该怎么做,请留下任何解决方案。谢谢。

0 投票
0 回答
38 浏览

r - 如何像记事本一样阅读文字?

我有一个 PDF 文件,它有这样的表格(只是比喻)

当我使用 PDFtools 或 tabulizer 包提取此表时,这些包会逐行提取此表。

所以第一行的结果是

但我想要的是正确提取这个

有什么方法可以提取正确吗?

也偶然我注意到,当我拖动并复制然后将此表粘贴到 Window 记事本时,记事本会像这样神奇地读取它;

所以我想制作一些代码,自动将表格粘贴到记事本,然后将其重新复制到 R,因此直接将其放入某个变量中。我也想知道如何在 R 编码中实现这一点。

0 投票
0 回答
58 浏览

r - rJava 包找不到 Java

我正在尝试运行制表程序包中需要的 rJava 包,但无论我做什么,rJava 都会报告相同的错误。

我已经安装了 Java:

我也设置了JAVA_HOME目录。也尝试过运行此命令:

但这也不好。

我目前使用的是 macOS Catalina 版本 10.15.3。

老实说,我想我已经阅读了这个论坛和其他论坛上关于这个问题的所有主题,但没有任何效果。

0 投票
0 回答
37 浏览

r - 从 R(调用 R 库)获取结果到 Java

我的问题如下:

  • 在我的 R Studio 终端机器上,我正在运行下一行:
  • 如何获得 java 程序的“结果”(它是一个列表)?

我想在我单独的 java 脚本中使用该结果(我正在运行 Eclipse)。

如果需要更多说明,我很乐意提供。

0 投票
0 回答
57 浏览

r - R mac catalina tabulizer 失败,出现 java 运行时缺失错误,但已安装 java

我想使用制表器从 pdf 中提取表格。它安装得很好,图书馆(制表器)加载得很好。但是,当我尝试在笔记本电脑上从 pdf 文件中运行 extract_tables 时,我被告知No Java runtime present, requesting install.正在使用 Catalina 的 Mac 上。Java 已安装并且我已经运行R CMD javareconf,但这无济于事。对此问题的早期版本的一些响应指向此网站 - https://support.apple.com/kb/DL1572?locale=en_US但无法安装旧版本的 Java。