问题标签 [readxl]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - 在 R 中使用 readxl 读取 excel 数据
我必须在 R 中读取一个 excel 文件。该 excelfile 有一列的值如 50%、20%... 和另一列的日期格式为“2017 年 12 月 12 日”,但 R 转换了这两个列数据。
我正在使用 readxl 包,并且我在 col_types 参数中指定了所有要作为文本读取的列,但是当我检查数据框时,所有列类型都是字符,但百分比数据和日期分别更改为小数和数字。
我想按原样阅读 excel 文件。任何帮助将不胜感激。
r - Importing xlsx data to R when numbers have a comma as decimal separator
How can I import data from a .xlsx
file into R so that numbers are represented as numbers, when their original decimal separator is comma not a dot?
The only package I know of, when dealing with excel is readxl
from tidyverse
.
I'm looking for a solution that won't need opening and editing excel files in any other software (and can deal with hundreds of columns to import) - if that would be possible I'd export all excels to .csv
and import them using tools I know of, that can take the dec=
argument.
So far my best working solution is to import numbers as characters and then transform it:
r - 在 R 中使用跨 3 行的列标题导入。用最新的非缺失列替换缺失
我需要帮助导入我的列标题分成 3 行的数据,其中隐含了一些标题名称。这是我的 xlsx 文件的样子
我想将数据导入 R,但我想保留第 1 行和第 2 行中的标题。另一个挑战是隐含了一些标题。如果标题为空白,我希望它使用左侧列中的单元格。我希望将其导入为的示例。
我目前的方法是导入,跳过第 1 行和第 2 行,然后根据已知位置重命名列。但是,我希望存在的代码会阻止我执行此步骤。谢谢!!
r - 从具有数千个选项卡的 excel 书中读取数据
我正在从单个 xlsx 文件中读取数据,数据存储在每个工作簿文件的 10-20,000个单独的选项卡中。第一张表包含一个主数据表,包括指向带有更多数据的各个选项卡的链接。基于列的“选项卡式”数据在附加到主数据之前进行汇总和转置。
主数据表本身很大(10'千行 x 数百列),附加数据选项卡本身很小(几列乘 10 到几'00 行)。
Using XLConnect
package crashed out-of-memory 在调用loadWorkbook()
(R 3.4.0、RStudio 1.1.383、64bit、8G 机器),否则我可以按照这个.
因为我需要从单个选项卡加载,我目前正在使用嵌套的 for() 循环来加载每个单独的选项卡数据。但是,对于我的选项卡数量,每个循环需要将近一分钟,使总执行时间接近一周!使用嵌套的 for() 循环也绝对不整洁,所以我怀疑有一种更整洁和(更)更快的方法来实现这一点,但看不到它。
我已经阅读了linkReferences
R 中专用 df ( ) 的链接。数据源不是我的,所以我坚持使用提供的输入。
这个问题纯粹与读取工作表的速度有关,它似乎随着文件中工作表的数量(以及文件大小)的增长而增长。
我正在寻找任何解决方案来加快速度,并使用独立的最小示例进行更新。在我的电脑上: n = 10
给出时间/张 0.16 秒、n = 100
~0.56 秒/张和n = 1000
~3 秒/张,这与我在真实数据中看到的相似(对于 16k 张,<10 秒/张)
r - 使用 read_excel 获取具有不同 col_types 集的多张工作表
我想读取一个包含多张工作表的 excel 文件并为每张工作表指定 col_types,以下是我的代码:
执行上面的代码,得到如下错误信息:
如何将正确的 .x 和 .y 放入代码中?
r - 从 R 中糟糕的 Excel 电子表格导入和整理
首先,请参阅此 url ,了解我正在格式化的数据类型的一个小示例。您会注意到我在工作表中突出显示了我要选择的两个区域。随着项目进出数据集,选择范围需要是动态的。对于第一部分,我认为这段代码就足够了:
第二部分是我被绊倒的地方......我想确保我在电子表格的另一个突出显示区域中选择了与我的“project_codes”完全相同的行子集。
我有许多以完全相同的方式格式化的工作表(并且命名约定是一致的 - Jan18、Feb18、Mar18),所以如果有人可以在解决第 1 部分后帮助我遍历工作表,则可以加分。
r - 在 R 中下载 Excel 文件
我正在尝试使用以下代码从澳大利亚统计局下载一个 Excel 文件(xls)。但是,每次我尝试使用read_excel
命令运行该行时,我的会话都会崩溃。
我认为当您将链接放入浏览器并以这种方式下载时,它可能与 excel 文件弹出窗口有关,但我不确定!
我需要在阅读之前更改文件吗?
任何帮助都会很棒。
r - 在函数中指定输入
如何将输入指定为 R 中函数中的唯一数字类?例如,
如果sheetname
根据需要改为提及read.xlsx()
,它应该能够打印一条消息以提供表号插入?
r - R:将工作表附加到 Excel 工作簿而不阅读整个工作簿
我有一个 26 mb 的 Excel 工作簿,我正在尝试向其中添加一个 42 kb 的工作表。使用 openxlsx 包,我有以下代码:
我注意到的是这段代码需要大约 2 分钟才能执行。我相信 R 正在读取整个 26 mb 文件,然后附加 42 kb 工作表。有没有办法将 42 kb 工作表附加到 26 mb 工作簿而无需读取 26 mb 文件?每次运行将节省 2 分钟。