问题标签 [readr]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - 读取 R 中的多个文件 - TAB 分隔文件
我想修改下面的一段代码,它读取了几个 .csv(逗号分隔值)文件,以通知它这些文件是制表符分隔的,即 .tsv 文件。
对于单个文件,我做了(使用 readr 包):
有什么帮助吗?谢谢,
里卡多。
r - 在 RStudio 中使用 CSV-Import 无法安装依赖项
我刚刚更新到 RStudio 1.0.136 并尝试导入 csv。因此它要我安装一个名为readr
. 如果我尝试这个,它会失败安装它的依赖tibble
并显示错误消息:
由于这似乎是包本身和C++ 代码集成的一些问题,除了提交错误报告之外我还能做些什么吗?
r - 日期列为字符格式时读取多个 csv 文件
我正在使用readr
andbind_rows()
函数来读取多个 csv。
示例代码:
当我这样做时,我收到一条错误消息:
第一列名称为“日期”,目前为字符格式。这就是我为第一列执行 str(df) 时的样子。
如果有人知道如何同时读取多个 csv 文件而忽略列的格式,例如 Date 列,那将会很有帮助!
r - 从 API 下载 CSV 文件
我正在尝试将 csv 文件放入 R 中。我制作了以下代码来创建指向 csv 文件的链接。当我在浏览器中使用生成的链接时,代码运行良好。但是当我运行代码时不能正常工作。希望有人可以提供帮助。
雅各布
r - 将txt文件的目录逐行读取到R数据框中,文件名为一列
我有一个文本文件目录。我想将这些文本文件的内容逐行读取到 R 数据框中。文本文件包含非结构化文本。所需的数据帧输出是:
我已经编写了下面的代码,但它会导致错误。我还猜想有一种更直接的方法可以做到这一点,例如readr
and dplyr
。
r - 在 csv 读取期间将字符串转换为 NA
我收到了一个化合物浓度的 csv 表。分散在各处的字符值具有各种含义,例如> 888
、<0.2
、/
等等。
有没有办法,最好使用 base R or readr
,NA
在读入时将它们转换为,从而仅从数字数据开始?
目前我只能找到一个依赖于对每个字符串进行硬编码的解决方案,这太困难和太耗时了。
r - 使用 `readr::read_csv_chunked()` 分块读取 csv 文件
我想读取更大的 csv 文件但遇到内存问题。因此,我想尝试read_csv_chunked()
从readr
包中分块阅读它们。我的问题是我并不真正理解这个callback
论点。
这是迄今为止我尝试过的一个最小示例(我知道我必须将所需的操作包含到f()
中,否则在内存使用方面不会有优势,对吧?):
我试图使callback
论点接近官方文档中的示例:
但是,由于我看到进度条移动到 18%,所以我收到了下面的错误,该错误似乎出现在第一个块被读取之后。
eval(替代(expr),envir,enclos)中的错误:未使用的参数(索引)
我已经尝试在其中包含我想要进行的操作f()
,但我仍然遇到同样的错误。
r - readr::read_csv() -- 传递要导入的字符列名向量
我正在编写一个函数,该函数接受从 CSV 文件中读取的列名向量,使用readr::read_csv()
.
我想从文件中只读取向量中的列名,并且我想使用readr
的默认列类型猜测算法。
有没有比创建col_guess()
如下命名规范列表更直接的方法来实现这一点?
r - r:readr:write_csv 如何压缩文件?
20MB+ 的 CSV 文件对电子邮件来说是不礼貌的。用户如何用最少的代码压缩文件?
非压缩任务是:
read_csv 可以很好地查看扩展并进行解压缩。什么是最简单的方法(不正确的代码)
请不要使用 linux tar 或 gz。它必须是为了赢得用户。
r - 在读取多个 CSV 文件时,base R 比 readr 更快
有很多关于如何读取多个 CSV 并将它们绑定到一个数据框中的文档。我有 5000 多个 CSV 文件需要读取并绑定到一个数据结构中。
特别是我在这里进行了讨论:Issue in Loading multiple .csv files into single dataframe in R using rbind
奇怪的是,base R 比我尝试过的任何其他解决方案都要快得多。
这是我的 CSV 的样子:
我创建了三种读取和绑定数据的方法。这些文件位于一个单独的目录中,我将其定义为:
方法 1:基础 R
方法 2: read_csv
在这种情况下,我创建了一个包装函数供 read_csv 使用
方法3: read_csv
+dplyr::bind_rows
我想不通的是,为什么 read_csv 和 dplyr 方法在它们应该更快的情况下会更慢。CPU时间减少了,但是为什么经过的时间(文件系统)会增加?这里发生了什么?
编辑- 我data.table
按照评论中的建议添加了方法
方法四 data.table
从 CPU 的角度来看,该data.table
方法是最快的。但问题仍然read_csv
在于使它们如此缓慢的方法发生了什么。