问题标签 [readr]

问问题

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

446 问题

0 投票

1 回答

468 浏览

r - 读取 R 中的多个文件 - TAB 分隔文件

我想修改下面的一段代码，它读取了几个 .csv（逗号分隔值）文件，以通知它这些文件是制表符分隔的，即 .tsv 文件。

对于单个文件，我做了（使用 readr 包）：

有什么帮助吗？谢谢，

里卡多。

r csv readr

2017-04-10T22:57:17.973

0 投票

2 回答

1244 浏览

r - 在 RStudio 中使用 CSV-Import 无法安装依赖项

我刚刚更新到 RStudio 1.0.136 并尝试导入 csv。因此它要我安装一个名为readr. 如果我尝试这个，它会失败安装它的依赖tibble并显示错误消息：

由于这似乎是包本身和C++ 代码集成的一些问题，除了提交错误报告之外我还能做些什么吗？

r rstudio readr

2017-04-13T08:11:42.123

0 投票

1 回答

174 浏览

r - 日期列为字符格式时读取多个 csv 文件

我正在使用readrandbind_rows()函数来读取多个 csv。

示例代码：

当我这样做时，我收到一条错误消息：

第一列名称为“日期”，目前为字符格式。这就是我为第一列执行 str(df) 时的样子。

如果有人知道如何同时读取多个 csv 文件而忽略列的格式，例如 Date 列，那将会很有帮助！

r lapply readr

2017-04-18T21:17:58.050

0 投票

0 回答

542 浏览

r - 从 API 下载 CSV 文件

我正在尝试将 csv 文件放入 R 中。我制作了以下代码来创建指向 csv 文件的链接。当我在浏览器中使用生成的链接时，代码运行良好。但是当我运行代码时不能正常工作。希望有人可以提供帮助。

雅各布

r readr

2017-04-20T19:20:06.010

0 投票

2 回答

1611 浏览

r - 将txt文件的目录逐行读取到R数据框中，文件名为一列

我有一个文本文件目录。我想将这些文本文件的内容逐行读取到 R 数据框中。文本文件包含非结构化文本。所需的数据帧输出是：

我已经编写了下面的代码，但它会导致错误。我还猜想有一种更直接的方法可以做到这一点，例如readrand dplyr。

r dplyr tidyverse readr

2017-04-23T15:31:09.270

0 投票

1 回答

97 浏览

r - 在 csv 读取期间将字符串转换为 NA

我收到了一个化合物浓度的 csv 表。分散在各处的字符值具有各种含义，例如> 888、<0.2、/等等。

有没有办法，最好使用 base R or readr，NA在读入时将它们转换为，从而仅从数字数据开始？

目前我只能找到一个依赖于对每个字符串进行硬编码的解决方案，这太困难和太耗时了。

r readr

2017-04-27T12:43:32.013

0 投票

2 回答

4054 浏览

r - 使用 `readr::read_csv_chunked()` 分块读取 csv 文件

我想读取更大的 csv 文件但遇到内存问题。因此，我想尝试read_csv_chunked()从readr包中分块阅读它们。我的问题是我并不真正理解这个callback论点。

这是迄今为止我尝试过的一个最小示例（我知道我必须将所需的操作包含到f()中，否则在内存使用方面不会有优势，对吧？）：

我试图使callback论点接近官方文档中的示例：

但是，由于我看到进度条移动到 18%，所以我收到了下面的错误，该错误似乎出现在第一个块被读取之后。

eval（替代（expr），envir，enclos）中的错误：未使用的参数（索引）

我已经尝试在其中包含我想要进行的操作f()，但我仍然遇到同样的错误。

r csv chunks readr

2017-04-28T09:52:42.440

0 投票

0 回答

1089 浏览

r - readr::read_csv() -- 传递要导入的字符列名向量

我正在编写一个函数，该函数接受从 CSV 文件中读取的列名向量，使用readr::read_csv().

我想从文件中只读取向量中的列名，并且我想使用readr的默认列类型猜测算法。

有没有比创建col_guess()如下命名规范列表更直接的方法来实现这一点？

现有技术：
do.call() 与此 SO 问题中确定的 cols_only() 一起使用

r csv import readr

2017-05-10T19:24:27.747

0 投票

2 回答

1125 浏览

r - r:readr:write_csv 如何压缩文件？

20MB+ 的 CSV 文件对电子邮件来说是不礼貌的。用户如何用最少的代码压缩文件？

非压缩任务是：

read_csv 可以很好地查看扩展并进行解压缩。什么是最简单的方法（不正确的代码）

请不要使用 linux tar 或 gz。它必须是为了赢得用户。

r zip readr

2017-05-11T14:33:42.827

0 投票

2 回答

1433 浏览

r - 在读取多个 CSV 文件时，base R 比 readr 更快

有很多关于如何读取多个 CSV 并将它们绑定到一个数据框中的文档。我有 5000 多个 CSV 文件需要读取并绑定到一个数据结构中。

特别是我在这里进行了讨论：Issue in Loading multiple .csv files into single dataframe in R using rbind

奇怪的是，base R 比我尝试过的任何其他解决方案都要快得多。

这是我的 CSV 的样子：

我创建了三种读取和绑定数据的方法。这些文件位于一个单独的目录中，我将其定义为：

方法 1：基础 R

方法 2： read_csv 在这种情况下，我创建了一个包装函数供 read_csv 使用

方法3： read_csv +dplyr::bind_rows

我想不通的是，为什么 read_csv 和 dplyr 方法在它们应该更快的情况下会更慢。CPU时间减少了，但是为什么经过的时间（文件系统）会增加？这里发生了什么？

编辑- 我data.table按照评论中的建议添加了方法

方法四 data.table

从 CPU 的角度来看，该data.table方法是最快的。但问题仍然read_csv在于使它们如此缓慢的方法发生了什么。

r tidyverse readr

2017-05-17T19:45:12.527

1 2 3 4 5 6 7 8 9 10

问题标签 [readr]

Reference