问题标签 [read.csv]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
6 回答
21497 浏览

r - 读取 R 中的 csv 文件,货币列为数字

我正在尝试将包含政治捐款信息的 csv 文件读入 R。据我了解,默认情况下将列作为因子导入,但我需要将数量列(数据集中的“CTRIB_AMT”)作为数字列导入,以便我可以运行各种不起作用的函数因素。该列被格式化为以“$”为前缀的货币。

我最初使用了一个简单的读取命令来导入文件:

然后尝试将 CTRIB_AMT 从货币转换为数字:

但这没有用。我尝试用于 CTRIB_AMT 列的函数是:

在此处查看相关问题。

关于如何最初导入文件以便列是数字或导入后如何转换它的任何想法?

0 投票
1 回答
12298 浏览

r - read.csv() - 三列中的两列

可能重复:
仅读取 R 中有限数量的列

我有一个由三列组成的 ascii 数据集,但只有最后两列是实际数据。现在我想使用read.csv(file = "result1", sep= " "). R 读取所有三列。我该如何避免这种情况?

0 投票
5 回答
113829 浏览

r - 为什么在读取数据框时我的列名中出现 X.?

几个月前我问了一个关于这个的问题,我认为答案已经解决了我的问题,但我又遇到了这个问题,解决方案对我不起作用。

我正在导入 CSV:

这是数据框的结构:

如果我length在第一列 OrderID 上运行命令,我会得到:

如果我length在 OrderDate 上运行,它会正确返回:

这是 的副本/head粘贴CSV

现在,如果我重新运行read.csv,但去掉check.names选项,现在的第一列dataframe在名称的开头有一个 X.。

这可以正常工作。

我的问题是为什么R要在第一列名称的开头添加 X.?从 CSV 文件中可以看出,没有特殊字符。它应该是一个简单的负载。添加check.names,虽然会从 CSV 导入名称,但会导致数据无法正确加载,我无法对其执行分析。

我能做些什么来解决这个问题?

旁注:我意识到这是一个小问题——我对我认为我加载正确但没有得到我预期的结果感到更加沮丧。我可以使用 重命名该列colnames(orders)[1] <- "OrderID",但仍然想知道它为什么不能正确加载。

0 投票
2 回答
4688 浏览

r - R 的 read.csv() 省略行

在 R 中,我试图读取大约 42,900 行的基本 CSV 文件(由 Unix 的 wc -l 确认)。相关代码是

其中 nrows 稍微高估了,因为为什么不呢。然而,

表明生成的数据框有大约 17,000 行。这是内存问题吗?每行由一个~30 个字符的哈希码、一个~30 个字符串和3 个整数组成,所以文件的总大小只有4MB 左右。

如果它是相关的,我还应该注意到很多行都缺少字段。

谢谢你的帮助!

0 投票
4 回答
3323 浏览

r - 导入具有多位数字的(64位)整数时,R中出现奇怪的错误

我正在导入一个 csv,它有一列包含很长的整数(例如:2121020101132507598)

a<-read.csv('temp.csv',as.is=T)

当我将这些整数作为字符串导入时,它们会正确通过,但是当作为整数导入时,最后几位数字会发生变化。我不知道发生了什么...

1 "4031320121153001444" 4031320121153001472
2 "4113020071082679601" 4113020071082679808
3 "4073020091116779570" 4073020091116779520
4 "2081720101128577687" 2081720101128577792
5 "4041720081087539887" 4041720081087539712
6 "4011120071074301496" 4011120071074301440
7 "4021520051054304372" 4021520051054304256
8 "4082520061068996911" 4082520061068997120
9 "4082620101129165548" 4082620101129165312

0 投票
0 回答
239 浏览

r - R 中的 read.csv/write.csv 同步

我有多个在一堆项目上运行的代码实例。项目列表包含在 projList.csv 中。当 R 实例选择一个项目时,它会在 projList.csv 中的项目名称前写入 1,以防止其他实例重做已经完成的工作。

我想避免以下同步问题: - 我不想在另一个进程正在写入列表文件时读取列表文件。- 当另一个进程正在写入或读取它时,我不想允许写入。

有没有办法做到这一点?

谢谢

0 投票
1 回答
17749 浏览

r - 导入 read.csv/read.xlsx 时将 NA 值插入数据框空白单元格

随附的屏幕截图显示了我刚刚从 excel 文件导入 R 的数据框的一部分。在空白的单元格中,我需要插入“NA”。如何将 NA 插入任何空白的单元格(同时保留已经填充的单元格)?

在此处输入图像描述

0 投票
4 回答
19848 浏览

r - Read.CSV 在 R 中无法按预期工作

我难住了。通常,read.csv按预期工作,但我遇到了一个行为出乎意料的问题。这很可能是我的用户错误,但我们将不胜感激。

这是文件的网址

这是我获取文件、解压缩并读入的代码:

这是我的问题。当我在 Excel 中打开数据 csv 数据时,数据看起来符合预期。当我将数据读入 R 时,第一列实际上命名为 row.names。R 正在读取一行额外的数据,但我无法弄清楚导致 row.names 成为一列的“错误”发生在哪里。简单地说,它看起来像数据转移了。

然而,奇怪的是 R 中的最后一列似乎包含正确的数据。

以下是前几列中的几行:

有什么想法我可能做错了吗?

0 投票
3 回答
36072 浏览

r - read.csv 与 read.table

我在几种情况下看到,虽然read.table()无法读取制表符分隔的文件(例如微阵列的注释表),但返回以下错误:

read.csv()在同一个文件上完美运行,没有错误。我认为也的速度read.csv()也高于read.table()

甚至更多:read.table()正在做非常疯狂的阅读我的文件。它在读取第 100 行时出现此错误,但是当我将第 90 行到第 110 行复制并粘贴到同一文件的开头之后,它仍然会出现第 100+21 行的错误(在开头复制了新行)。如果该行有任何问题,为什么它在读取开头粘贴的行时不报告该错误?我确认read.csv()读取相同的文件没有错误。

您是否知道为什么read.table()无法读取在其上read.csv()工作的相同文件?还有任何理由read.table()在任何情况下使用吗?

0 投票
4 回答
55713 浏览

r - 在 read.table/read.csv 中为 colClasses 参数指定自定义日期格式

问题:

在 read.table/read.csv 中使用 colClasses 参数时,有没有办法指定日期格式?

(我意识到我可以在导入后转换,但是有很多这样的日期列,在导入步骤中会更容易)


例子:

我有一个 .csv 格式的日期列%d/%m/%Y

这会导致转换错误。例如,15/07/2008变成0015-07-20


可重现的代码:

这是输出的样子:

代码输出