问题标签 [readr]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
468 浏览

r - 读取 R 中的多个文件 - TAB 分隔文件

我想修改下面的一段代码,它读取了几个 .csv(逗号分隔值)文件,以通知它这些文件是制表符分隔的,即 .tsv 文件。

对于单个文件,我做了(使用 readr 包):

有什么帮助吗?谢谢,

里卡多。

0 投票
2 回答
1244 浏览

r - 在 RStudio 中使用 CSV-Import 无法安装依赖项

我刚刚更新到 RStudio 1.0.136 并尝试导入 csv。因此它要我安装一个名为readr. 如果我尝试这个,它会失败安装它的依赖tibble并显示错误消息:

由于这似乎是包本身和C++ 代码集成的一些问题,除了提交错误报告之外我还能做些什么吗?

0 投票
1 回答
174 浏览

r - 日期列为字符格式时读取多个 csv 文件

我正在使用readrandbind_rows()函数来读取多个 csv。

示例代码:

当我这样做时,我收到一条错误消息:

第一列名称为“日期”,目前为字符格式。这就是我为第一列执行 str(df) 时的样子。

如果有人知道如何同时读取多个 csv 文件而忽略列的格式,例如 Date 列,那将会很有帮助!

0 投票
0 回答
542 浏览

r - 从 API 下载 CSV 文件

我正在尝试将 csv 文件放入 R 中。我制作了以下代码来创建指向 csv 文件的链接。当我在浏览器中使用生成的链接时,代码运行良好。但是当我运行代码时不能正常工作。希望有人可以提供帮助。

雅各布

0 投票
2 回答
1611 浏览

r - 将txt文件的目录逐行读取到R数据框中,文件名为一列

我有一个文本文件目录。我想将这些文本文件的内容逐行读取到 R 数据框中。文本文件包含非结构化文本。所需的数据帧输出是:

我已经编写了下面的代码,但它会导致错误。我还猜想有一种更直接的方法可以做到这一点,例如readrand dplyr

0 投票
1 回答
97 浏览

r - 在 csv 读取期间将字符串转换为 NA

我收到了一个化合物浓度的 csv 表。分散在各处的字符值具有各种含义,例如> 888<0.2/等等。

有没有办法,最好使用 base R or readrNA在读入时将它们转换为,从而仅从数字数据开始?

目前我只能找到一个依赖于对每个字符串进行硬编码的解决方案,这太困难和太耗时了。

0 投票
2 回答
4054 浏览

r - 使用 `readr::read_csv_chunked()` 分块读取 csv 文件

我想读取更大的 csv 文件但遇到内存问题。因此,我想尝试read_csv_chunked()readr包中分块阅读它们。我的问题是我并不真正理解这个callback论点。

这是迄今为止我尝试过的一个最小示例(我知道我必须将所需的操作包含到f()中,否则在内存使用方面不会有优势,对吧?):

我试图使callback论点接近官方文档中的示例:

但是,由于我看到进度条移动到 18%,所以我收到了下面的错误,该错误似乎出现在第一个块被读取之后。

eval(替代(expr),envir,enclos)中的错误:未使用的参数(索引)

我已经尝试在其中包含我想要进行的操作f(),但我仍然遇到同样的错误。

0 投票
0 回答
1089 浏览

r - readr::read_csv() -- 传递要导入的字符列名向量

我正在编写一个函数,该函数接受从 CSV 文件中读取的列名向量,使用readr::read_csv().

我想从文件中只读取向量中的列名,并且我想使用readr的默认列类型猜测算法。

有没有比创建col_guess()如下命名规范列表更直接的方法来实现这一点?


现有技术:
do.call() 与此 SO 问题中确定的 cols_only() 一起使用

0 投票
2 回答
1125 浏览

r - r:readr:write_csv 如何压缩文件?

20MB+ 的 CSV 文件对电子邮件来说是不礼貌的。用户如何用最少的代码压缩文件?

非压缩任务是:

read_csv 可以很好地查看扩展并进行解压缩。什么是最简单的方法(不正确的代码)

请不要使用 linux tar 或 gz。它必须是为了赢得用户。

0 投票
2 回答
1433 浏览

r - 在读取多个 CSV 文件时,base R 比 readr 更快

有很多关于如何读取多个 CSV 并将它们绑定到一个数据框中的文档。我有 5000 多个 CSV 文件需要读取并绑定到一个数据结构中。

特别是我在这里进行了讨论:Issue in Loading multiple .csv files into single dataframe in R using rbind

奇怪的是,base R 比我尝试过的任何其他解决方案都要快得多。

这是我的 CSV 的样子:

我创建了三种读取和绑定数据的方法。这些文件位于一个单独的目录中,我将其定义为:

方法 1:基础 R

方法 2: read_csv 在这种情况下,我创建了一个包装函数供 read_csv 使用

方法3: read_csv +dplyr::bind_rows

我想不通的是,为什么 read_csv 和 dplyr 方法在它们应该更快的情况下会更慢CPU时间减少了,但是为什么经过的时间(文件系统)会增加?这里发生了什么?

编辑- 我data.table按照评论中的建议添加了方法

方法四 data.table

从 CPU 的角度来看,该data.table方法是最快的。但问题仍然read_csv在于使它们如此缓慢的方法发生了什么。