问题标签 [read.csv]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
650 浏览

r - 将 CSV 文件导入 R,大写

新手 R 用户在这里...

我正在使用下面的代码导入文件夹中的所有 csv 文件:

这些 CSV 文件实际上在后面的代码中充当查找表。为了避免用户错误,我很好奇是否有可能在导入文件时将每个数据框中的任何字符数据(不是标题)转换为大写。

当然,我可以手动更改每个 csv 文件,但宁愿避免这样做。

0 投票
1 回答
594 浏览

r - 如何读取包含多个嵌入数据集和非打印字符的格式错误的 CSV 文件

我需要使用下图中的以下选项打开一个 CSV 文件。我将链接添加到我的文件。您可以尝试使用文件“20140313_Helix2_FP140_SC45.csv”

https://www.dropbox.com/sh/i5y8r8g7wymalw8/AABXsLkbpowxGObFpGHgv4m-a?dl=0

在此处输入图像描述

我已经尝试了 read.table 和 read.csv 的许多选项,但我需要一个包含多列的数据框并且数据是分开的。

0 投票
2 回答
244 浏览

r - 用R中的字符串标题行减去两个相同大小的矩阵

我有两个从 csv 文件导入的矩阵。它们具有相同的行数和列数。我需要第三个矩阵,这将是两个矩阵的元素减法。

t1 看起来像这样:

和 t2 像这样:

试:

不起作用,它会引发:

警告消息:在 Ops.factor(left, right) 中:'-' 对因子没有意义

可能是因为 t1 和 t2 包含行和列的字符串标题(这对于其余操作很重要)。

在不考虑每行和每列的字符串的情况下,我将如何减去两个矩阵?

0 投票
1 回答
47 浏览

r - 使用 read.csv() 时的特殊分隔符

我有很多使用“|”的 .csv 文件 作为分隔符:

1492624841097281|"19026960706021"|"3112642370"|"50000"|"0"|"越南盾"|""|""|"50000

我试着像下面这样阅读它们

我希望这些列将被分开,但它没有用。请帮我!非常感谢。

0 投票
2 回答
1937 浏览

r - read.csv 列的零和一为逻辑

如何将一列 1 和 0 直接读入 as logical,从而避免后续转换?

在大型 csv 文件中,有几列的值为零或一,我想将其用作 R 中的逻辑变量。

如果我将它们指定colClasses为逻辑,则read.csv抱怨预期的“逻辑”,得到“0”

另一方面,read.csv如果我将它们指定colClasses为整数,则成功。之后,我可以使用as.logical().

0 投票
2 回答
7996 浏览

r - 如何检查 CSV 文件是否有逗号或分号作为分隔符?

我必须自动读取大量 CSV 文件。有些有逗号作为分隔符,然后我使用 command read.csv()

有些有分号作为分隔符,然后我使用read.csv2().

我想编写一段代码来识别 CSV 文件是否有逗号或分号作为分隔符(在我阅读之前),这样我就不必每次都更改代码。

我的方法是这样的:

这样的事情可能吗?以前有人这样做过吗?如何在没有实际看到的情况下检查是否有错误?

0 投票
0 回答
74 浏览

r - R read.csv 如何不将数字转换为数值,而是将它们保存为字符串

我有一个 CSV 文件,所有值都用双引号括起来。一列是 id 列,它包含如下值:

我遇到的问题是,无论我指定什么选项(as.is=T、、stringsAsFactors=Fnumerals='no.loss'),它总是将此 id 列读取为数字并删除前导 0。这是一个如此基本的操作,我真的很困惑,我找不到解决方案。

0 投票
2 回答
308 浏览

r - 从 CSV 解析货币值,将数字后缀转换为百万和十亿

我很好奇R中是否有任何开箱即用的函数可以处理这个问题。

我有一个 CSV 文件,我正在使用 read.csv 将其读入数据框。CSV 中的一列包含格式为

我想将它们转换成更有用的数字,可以对其进行计算,所以它看起来像这样:

我最初的想法是根据包含 *M、*B 或 N/A 的行以某种方式将数据帧分成 3 个部分。然后使用 gsub 替换 $ 和 M/B,然后将剩余的数字乘以 1000000 或 1000000000,最后将 3 个子集重新加入到 1 个数据帧中。

但是我很好奇是否有更简单的方法来处理 R 中的这种转换。

0 投票
1 回答
187 浏览

r - 有没有办法在 R 中显示“打开文件向导”而不是通过 read.csv 加载文件?

我想为用户提供一个选项,只需选择 csv 文件即可打开他/她想要的任何文件。R中是否有任何选项可以这样做?令人惊讶的是我找不到这样的功能。

0 投票
2 回答
246 浏览

r - 加速 R 脚本循环遍历文件/文件夹以检查阈值、计算平均值和绘图

我正在尝试加快 R 中的一些代码。我认为可以替换我的循环方法(可能使用某种形式的 lapply 或使用 sqldf),但我似乎无法弄清楚如何。

基本前提是我有一个包含 ~50 个子目录的父目录,每个子目录包含 ~200 个 CSV 文件(总共 10,000 个 CSV)。这些 CSV 文件中的每一个都包含约 86,400 行(数据每天按秒计算)。

该脚本的目标是计算每个文件的两个时间间隔的平均值和标准差,然后为每个子目录制作一个汇总图,如下所示:

非常感谢您提供的任何建议!