问题标签 [readxl]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
64 浏览

r - 将选项卡式电子表格导入R中的列表

我的数据以选项卡式电子表格的形式存在,我正在尝试编写一个脚本来导入它。

这有效,在环境中为我提供了多个数据表:

  • 选项卡1
  • 选项卡2 ...

我想做的是将这些输出作为列表中的项目:

但我不能让它正常工作

两者都给出:

这显然是我在识别 sheetname 变量时的错误。

请问这样做的正确方法是什么?

0 投票
4 回答
18596 浏览

r - 将具有多张工作表的多个 xlsx 文件读入一个 R 数据帧

我一直在阅读有关如何读取多个 xlsx 文件并将其组合到一个 R 数据框中的内容,并且遇到了一些非常好的建议,例如如何使用具有特定行和列的循环在 R 中读取多个 xlsx 文件,但不适合我的数据设置至今。

我希望 R 读取具有多个工作表的多个 xlsx 文件。所有工作表和文件都具有相同的列,但长度不同,应排除 NA。我想跳过前 3 行,只输入 1:6、8:10、12:17、19 列。

到目前为止,我尝试过:

但这只会占用每个文件的所有第一张纸

有谁知道如何将所有工作表和文件放在一个 R 数据框中?

此外,对于大型数据集,您会推荐哪些软件包?到目前为止,我尝试了 readxl 和 XLConnect。

0 投票
2 回答
206 浏览

r - 即时删除所有具有名称的列

我正在使用read_excel导入 Excel 文件的速度和简单性。

不幸的是,目前还没有从数据集中排除不需要的选定列的能力。为了节省精力,我"x"col_names参数命名这些列,这比尝试跟踪 ,x1等更容易x2

如果可能的话,我想即时排除这些列,以避免额外的复制步骤,所以在伪代码中:

我们可以使用readxl包中包含的示例数据集进行说明:

我看到的工作方法并不完全是即时工作的,例如,已经存储了DF,我们现在可以这样做:

这可行,但需要通过存储复制DF它,然后覆盖它;我宁愿删除同一命令中的列,以便正确read_excel分配ab initioDF

其他类似的方法需要声明临时变量,如果可能的话,我更愿意避免,例如,

有没有办法在不创建不必要的临时变量的情况下删除这些列?

(我可以转换为data.table,但我想知道是否有办法在没有 的情况下这样做data.table

0 投票
1 回答
860 浏览

r - 在 R 中绘图无法识别/绘制从 readxl 包中检索到的数据

几个月前,我构建了一个闪亮的应用程序,主要输出是一个绘图。我的数据来自excel表格,我已经使用readxl包将数据拉入R。我最近更新了excel数据,现在plotly将不再绘制数据。从闪亮应用:

是输出的开始构建块。当我启动应用程序时,我看到一条错误消息

错误:不支持的索引类型:NULL

情节曾经在哪里。我试图在 RStudio 中逐步构建绘图,但我的输出是一个没有任何数据点的空白 x,y 图。如果我手动构建向量:

我得到了一个功能齐全的plotly图表。

0 投票
0 回答
1256 浏览

r - 使用 readxl 包中的 read_excel() 读取混合的数字和文本列

我正在尝试使用包中的大量旧版 Excel 97-2003 文件 ( .xls) 。这些文件中的一列是带有一些空格的字母数字代码(例如,等)。在原始 Excel 文件中,该列中仅包含数字的单元格具有of,而包含字母和空白单元格的单元格具有of 。read_excel()readxl"", "1", "1A", "1B", "2", "3", "3A"TYPE()1TYPE()2

当我使用 读取文件read_excel()时,数据框中的相应列会自动转换为类型chr(这是我想要的),但是只包含数字的元素最终被编码为小数,所以我最终得到"", "1.000000", "1A", "1B", "2.000000", "3.000000", "3A"等。强制转换为文本read_excel(..., coltypes = c(...,"text",...)似乎没有任何区别。

我可以通过一些小技巧轻松修复生成的数据框regex,但是有没有办法首先避免这种情况?

0 投票
1 回答
1146 浏览

r - 在excel的工作表名称中使用正则表达式

我有 100 多个 excel 文件,每个文件有 50 张。我正在尝试从每个文件中读取一张。我尝试读取的工作表的位置和名称因每个文件而异。

但是,每个文件中的工作表名称(我正在尝试读取)始终包含“验证”一词。所以,我试图从 100 个文件中读取包含单词 validate 的工作表。这需要我使用正则表达式(比如“grepl”来选择包含“validate”这个词的工作表)。我想知道这是否可能。

据我所知,read_excel 和 xlsx 包不允许这样做。我想要以下内容:

0 投票
1 回答
1887 浏览

r - 使用 readxl 将 excel 文件读入 R 时缺少数据框列

我在使用readxl包中的 read_excel 函数将 xls 文件读入 R 时遇到了一些问题。生成了数据框,但它至少缺少一列,并且我多次打印以下消息:

这是我正在尝试的命令:

电子表格的前两行(跳过前三行)如下所示:

读入 R 后数据帧的前两行看起来像这样,并且似乎缺少最后一列。

这是 xls 文件的链接。该文件由水湿度记录器生成,与软件生成的默认设置相同。 https://drive.google.com/file/d/0BzGqPx_G2wnhUzk2eWpNYlBYdHM/view?usp=sharing

我正在运行 readxl 版本 0.1.1.9000、R 版本 3.2.4 和 Ubuntu 16.04.1

感谢您的任何帮助!

0 投票
2 回答
14207 浏览

r - 使用 readxl 时出错:“exdir”不存在

我正在尝试使用 readxl::read_excel 将表格数据从 excel 电子表格(.xlsx 和 .xls)导入 R。从 Desktop 读取电子表格时,我使用此功能取得了成功,但从 Documents 文件夹中读取时遇到问题现在。

我尝试读取同一文件的 .xlsx 和 .xls 格式,并收到 2 条不同的错误消息。

第二条消息让我觉得我没有在这里读/写数据的权限,但我一直在这里创建文件夹/文件。我什至使用了另一个 R 库 readr 包从同一目录导入 .csv 文件。

根据我看到的其他帖子,这似乎是一个权限问题,但我不清楚如何解决它。

我尝试使用 Sys.setenv() 将临时文件夹位置更改为我知道我有权写入的位置(即桌面),因为我认为 readxl 在读取数据时使用了这些路径。但这不起作用,因为我收到了完全相同的错误消息。

我在工作中使用 PC,而 Documents 文件夹实际上是一个网络驱动器。我已经使用 read_excel 从其他网络文件夹导入 .xlsx 文件,但这给我带来了麻烦。以下是有关我正在使用的系统的更多信息。

0 投票
2 回答
132 浏览

r - 使用 R 包合并多个 .xlsx 文件(按列)在标题前带有垃圾文本的问题:readxl 并写入 csv

我对 R 和一般编程非常陌生,需要帮助来排列包含在 ~2000 个 .xls 和 .xlsx 文件中的数据。每个文件以标题前 34 - 40 行“垃圾”文本开始;标题下的所有数据都具有相同的维度。

我尝试的第一种方法将数据添加到列表中;垂直格式没有用。

我目前正在尝试一次读取一个文件,删除“垃圾”文本,然后写入 .csv 文件(按列附加数据)。

以下行引发错误:

错误:“C:\Users\jlmine\Desktop\qPCRextData\”不存在。另外:警告消息:在 1:dim.data.frame(file.list) 中:
数值表达式有 2 个元素:只使用第一个

“C:\Users\jlmine\Desktop\qPCRextData\”被设置为我的工作目录任何想法将不胜感激。

0 投票
1 回答
1499 浏览

r - read_excel 将数字重新编码为 na 值

read_excel在使用包中的函数从 excel 文件中导入数据时readxl,我尝试为na参数指定一个数字,但它不会重新编码缺失的值。数据以数值作为缺失响应输入。

示例数据(虽然在 r 而不是 excel 文件中):

如果上述数据是一个单独的 excel 文件,我尝试像这样读取它:

与其将 99 重新编码为 NA,不如将它们作为数字读入。我希望看到这样的数据框,而不必使用单独的步骤来重新编码数据: