问题标签 [readxl]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
80 浏览

r - 检测包含名称的行

我需要检测我的第一行观察结果是否是一行名称。当我导入数据时,总是从电子表格(readxl 包)作为字符列导入。

根据数据的结构,一个非名称行,总是包含至少 8 个数值。

所以,在这个逻辑中,我使用隐式强制来完成我的任务。从最初是数字类元素的字符元素开始,强制转换很简单。但是对于最初是文本字符串的元素,隐式强制转换失败并抛出 NA。规则是:

此功能解决了问题,但存在另一种更正式的方式来做到这一点? 我的意思是,避免在输出中出现强制的警告信息。

0 投票
0 回答
661 浏览

r - R read_excel:如何获得正确的时间戳

我正在使用Rread_excel中的readxl包读取 xlsx 文件。我的列中有一个字符串,因此readxl将其作为字符串获取。但是,日期时间在之前转换为数字,然后作为字符串给出。使用as.Date我可以正确获取日期时间的日期部分,但我丢失了时间戳。使用as.POSIXct不同的来源不会给出正确的时间戳。这是一个例子:

Excel 中出现的时间:28/09/2016 14:47 由 read_excel 读取为字符串:"42641.6163310185" 以下无法给出28/09/2016 14:47

什么是正确的转换,read_excel函数是否丢失了一些信息?

编辑:从R中的数据差异as.POSIXct与 Excel转换是*86400我不知道的。以下作品:

0 投票
0 回答
1684 浏览

r - 无法使用 readxl 将 .xlsx 导入 R

这是我的代码:

这是我得到的错误:

0 投票
1 回答
3968 浏览

r - read_excel 读入消息 - 抑制?

我喜欢使用这个readxl包。但是,我一直将它用作 RMarkdown 文档的一部分,并且read_excel()在读取文件时的一些消息在进行分析时很有用,但在尝试呈现分析时却没有用。所以问题是,有没有办法在使用时抑制收到的消息(或任何警告消息)read_excel?我将采用 RMarkdown 或 read_excel 解决方案。

这是我要禁止显示的消息类型的说明。出现在我最终的 Rmarkdown 文档中:

我无法找到一种方法从 url 读取 excel 文件,read_excel因此我无法在此处制作可重现的示例。

0 投票
5 回答
17493 浏览

r - 使用 readxl 包从 URL 读取 Excel 文件

考虑互联网上的一个文件(比如这个(注意 https 中的 s)https://evs.nci.nih.gov/ftp1/CDISC/SDTM/SDTM%20Terminology.xls

如何将文件的第 2 页读入 R?

以下代码是所需的近似值(但失败)

0 投票
1 回答
6213 浏览

r - 使用 read_excel(na = ) 如何指定多个 NA 字符串?

我正在尝试将一个使用多个 NA 值(特别是“N/A”和“n/a”)的 Excel 表读入 R。如果我尝试给 na= 一个字符串列表,则会引发错误:

关于如何在两个字符串都转换为 NA 的情况下读取此内容的任何想法?或者,一旦数据在 R 中,我是否最好进行查找/替换?

0 投票
2 回答
1045 浏览

r - 如何将多文件 .xlsx 数据导入没有级别的单个 R 数据帧?

我正在尝试从此处提供的一些免费的 NASDAQ 100 Twitter 数据集中提取每家公司的数据。一旦构建和策划,最终目标是使用数据框运行一些建模实验。我想要的基本数据框形式是:

对于每家公司,有六个 .xlsx 文件(解压缩到单独的目录中),每个 excel 文件里面有多个工作表。目前,我只是尝试从每家公司的六个 excel 电子表格中的每一个中提取第一个工作表。所有这些工作表都有两列,行数不同,数据标签位于不同的行上,例如文件 1,公司 1:

文件 2,公司 1:

我正在尝试readxl按照这篇文章中的建议实施,然后将每个公司的数据放入一行数据框 [下]。现在,我将第一个路径设置为我的目录,然后运行代码,然后设置第二个路径并再次运行它以添加新行(我知道这不是最佳的,见下文)。

样本输出:

经过检查,我发现我从其他各种帖子中收集的列中有一些级别是因为我导入数据的方式以及我尝试添加stringsAsFactors=FALSE到的原因as.data.frame,但显然这不是解决方案:

根据文档,这不是read_excel. 有没有办法仍然使用它,但避免这些级别?

一旦我解决了这个问题,我希望在一个基本的 for 循环中得到它来遍历所有解压缩的子目录:

但这会产生> cdf data frame with 0 columns and 0 rows? 我知道没有一个代码是优雅或紧凑的(并且 rbind 在 for 循环中是不明智的),但这是我能够拼凑起来的。我非常乐于接受样式更正和替代方法,但如果它们的上下文在此处描述的整体问题/解决方案中得到解释,将不胜感激(即:不仅仅是“使用包 xyz”或“读取 ldply()的文档”)。

谢谢,

0 投票
2 回答
5112 浏览

r - 将列名读取为日期格式

我在 Excel 中有如下日期,首先col1是 char,从col2tocol5是日期格式(mm/dd/yyyy)

我尝试使用库将上述文件导入 R readxl,结果显示日期格式的列名在数据集中显示为数字,

如何导入相同格式的 Excel 日期列?

0 投票
2 回答
5767 浏览

r - 使用 R 读取 excel-colorinfo

有没有办法用R从excel文件中读出单元格的颜色索引?

虽然我可以使用XLConnector之类的包设置单元格颜色XLSX,但我发现无法从现有工作簿中提取颜色信息。

0 投票
1 回答
836 浏览

r - 使用 read_excel 从 .xls 文件中读取时缺少列

我正在使用R version 3.3.2最新的readxl软件包。我正在使用read_excelfromreadxl包来读取 .xls 和 .xlsx 文件。

在正确Rstudio server读取readxl.xls 和 .xlsx 文件时。

在 上部署应用程序后Rshiny Pro server v1.5.2,应用程序正在.xlsx正确读取文件,但在读取.xls文件时它没有读取所有列。

也运行colnames(excel_data_frame)返回什么。通过运行,ncol(excel_data_frame)我发现.xls 文件excel_data_frame6 columns10 columns. 我得到了实际的行数。

谁能指导我解决这个缺失列的问题?