问题标签 [read.csv]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
4480 浏览

r - 读取 csv 中的列多于 R 中的列名

所以我正在尝试将 csv 读入 R,如果我使用

我收到一个错误

这是因为日期不是唯一的,因为每天都会玩多个游戏。因此,我尝试使用this删除最后一列,但仍然出现相同的错误。

问题的原因,我读完后认为因为我的最后一列没有标题

因此我做了这个

现在我有一个数据框,它的所有列名都被转移了,右边有一个空列

解决此问题或避免问题的最佳方法是什么?

另外,如果有人告诉我如何添加 csv,我可以上传它,以便你们可以看到原始数据。

此外,手动更改 csv 将不起作用,因为这需要外推到更多类似这样的 csv

0 投票
1 回答
157 浏览

r - 根据 colnames 中的子字符串更改 coltypes

我有一个非常大的销售数据数据框(df8)。加载时,一些我想要数字的变量加载为 chr。我想将 colname 包含单词“Order”的每一列从 chr 更改为 numeric。我怎样才能做到这一点?

0 投票
2 回答
60 浏览

regex - 如何从 R 中的 csv 数据中删除 [1]s、[[1]]s 和双引号?

我有一个 CSV 文件。它包含一些之前的 R 操作的输出,因此用索引号填充(例如 [1]、[[1]])。当它读入 R 时,它看起来像这样,例如:

(我不知道为什么在行号和输出数据之间浪费了所有空间)

我需要将上述数据显示如下(不带 [1] 或 [[1]] 或“”,并将数据放在其相应数字旁边,例如):

(可能789和其对应的数据PNG,D115,DX06,Slz应该由一个选项卡分隔.. 和每一行一样)

如何在 R 中实现这一点?

0 投票
0 回答
47 浏览

r - 如何读取 R 中某些行包含“\n”的 csv 表

我正在尝试读取我在 R 中创建的 csv 文件。某些行包含以下字符名称:“药物 a + 药物 B \n 药物 C + 药物 D”

当我想阅读它时,我没有添加 \n 和带有 NA 的附加行之后的部分。所以我的问题很简单,如何读取某些行包含“\n”的csv文件?

谢谢你的帮助

阿齐兹

0 投票
1 回答
43 浏览

r - 使用 R 中的分隔符将行拆分为列

我的数据是这样的:

我想首先将其分成不同的列,然后在每一行上应用一个函数来计算逗号分隔值的差异,例如 (237-204)。无需使用外部库包。

0 投票
1 回答
8689 浏览

r - R read.csv 如何忽略回车?

我需要阅读一个文本文件(制表符分隔),其中一些字段中有一些回车符。

如果我使用 read.table,它会给我一个错误:

如果我使用 read.csv,它不会给出错误,而是在该位置创建一个新行,将下一个字段放在新行的第一个字段中。

我怎样才能避免这种情况?我无法更改文件本身(脚本将在其他地方运行)。损坏的字符串也没有引号(文件中没有字符串)。一种选择是将回车读取为单个空格或 \n,但如何?

0 投票
1 回答
310 浏览

r - `如何读取数据集并从测量变量中删除逗号

我在从存储的数据框中创建线性模型时遇到问题,因为自变量包含逗号分隔符(即 314,567.5 与 314567.4)。我如何使用read.csvreadr读取数据集并返回该特定列中没有逗号的数据框?

0 投票
0 回答
82 浏览

r - 从 R 中的 .csv 和 .xlsx 文件读取数据时遇到问题

我正在尝试在 R 中导入一些数据,但导入的数据与原始数据的不同之处在于较小的数字,我无法理解为什么。

首先,我尝试使用 read.csv 导入文件“test 1.csv”,其中包含一个数字:

1761,74956350536

但是导入的号码和原来的不一样:

我首先考虑 R 可能试图将数据读入一种不能容纳这么多数字的变量。但实际上,R 读取的数字比原来的数字“更精确”(位数更多)。它被正确读取为数字类型(因此是双精度浮点)。

然后我尝试将 x 写回另一个 .csv 文件:

结果是原始数字(1761,74956350536)被“恢复”了。

然后我认为这可能与打印功能的工作方式有关,并且 read.csv 读取的数字是正确的。然后,我在 Excel(测试 2.xlsx)中创建了一个电子表格,其中包含五个数字,第六列中这些数字的总和。然后将其导出为 .csv 文件。生成的文件(测试 2.csv)读取:

1761,749563505360000;2819,170384367300000;39,526631074886200;1600,629524205790000;0,556813868271186;6221,632917021610000

请注意,该系列的第一个数字与原始“test 1.csv”文件中包含的数字相同。然后我将它导入 R 并检查总和。

前五个数字不再加起来第六个。

我尝试了其他导入方法,直接从 .xlsx 文件,同时使用 xlsx 和 openxlsx 包:

和:

现在我们仍然得到第三个数字,与原来的数字不同,也与 read.csv 读取的数字不同。再次 write.xlsx 将原始数字“恢复”为“test 2 out.xlsx”。在这种情况下,检查的总和匹配,但不幸的是,对于我目前正在处理的更大数字集的这些包和函数,情况并非如此。

我觉得我在问一些显而易见或众所周知的事情(我是新手......),因为操作非常简单。但我确实在这里不知所措。有谁知道为什么会这样?有没有办法避免/纠正/规避这种行为?任何帮助将不胜感激。

(我在 Linux Mint 17.1 Rebecca 机器上运行 R 版本 3.2.0(通过 RStudio)。)

0 投票
0 回答
413 浏览

r - 从 R read.csv 对象获取单元格元素?

在 R 中,我试图从read.csv对象中获取单元格值。但这就是我得到的:

其中,sp.csv 是 read.csv 对象变量。即使我尝试变体,例如:a$V1[[1]]或者a[['V1']][1]我做错了什么,有什么建议吗?我需要的是来自 V1 和 V2 的值。

0 投票
1 回答
2609 浏览

r - R:读取 .csv 将所有“”(空格)变为 NA

我有一个数据集,其中我将所有“~”值转换为空格“”,当我使用 View() 函数查看数据集时,我可以清楚地看到空格。但是,在我通过 write.csv 将修改后的数据框保存为 .csv 文件并通过 read.csv 在 R 中再次读取后,所有空格都以某种方式更改为 NA 值。我试图再次将我所有的 NA 值更改回空格,但是当我保存为 csv 并再次读取时会出现同样的问题。

任何帮助,将不胜感激!