问题标签 [read.csv]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
126 浏览

r - 使用中文字符而不更改 R 中的语言环境

我可以在 R 中使用汉字,可以将它们放在 data.frame 中的字符串中,用 gsub 替换它们,它们可以正常显示在屏幕上。我可以使用 write.table 将它们保存到文件中,但我无法使用 read.table 读取它们!我将 fileEncoding="UTF-8" 用于 write.table 和 read.table,但后者给了我:

我读过有关更改语言环境的文章,但如果中文字符在其他任何地方都可以使用,我不想弄乱语言环境(我的机器混合使用英语和葡萄牙语语言环境)。那可能吗?

我在 Ubuntu 14.10 中使用 RKWard。

编辑:中文字符在文件中的任何地方都可以正常工作,它们在用于引用时只会产生错误......

0 投票
2 回答
1112 浏览

r - 快速组合和转置许多固定格式的数据集文件

我有:~100 个 txt 文件,每个有 9 列和 >100,000 行我想要的:一个组合文件,只有 2 列但所有行。那么这应该转换为> 100,000列和2行的输出。

我创建了以下函数来系统地浏览文件夹中的文件,提取我想要的数据,然后在每个文件之后,与原始模板连接在一起。

问题:这在我的小测试文件上运行良好,但是当我尝试在大文件上执行此操作时,我遇到了内存分配问题。我的 8GB RAM 还不够,我认为其中一部分是我编写代码的方式。

我的问题:有没有办法遍历文件,然后在最后一次全部加入以节省处理时间?

另外,如果这是放置这种东西的错误地方,那么有什么更好的论坛来获取 WIP 代码的输入?

提前致谢。

0 投票
3 回答
3152 浏览

r - 在 R 中加载 csv 时如何删除特殊字符?

我有这个类似的问题:read.csv 警告“引用字符串中的 EOF”阻止完整读取文件

也就是说,当我加载 csv R 时说:

我可以通过应用来摆脱这个错误:quotes="" to read.csv

但主要问题仍然存在,总共只有 22111 行 689233 被读入 R。我想尝试从 csv 中删除所有特殊字符,看看这是否能解决问题。

相关我发现了这个:如何删除 R 中的特定特殊字符

但是有没有办法在 read.csv 中做到这一点,即在我读取文件的阶段?

0 投票
2 回答
9925 浏览

r - R:读取 .csv 文件会删除前导零

我意识到读取 .csv 文件会删除前导零,但对于我的某些文件,它会保留前导零,而无需我在 read.csv 中显式设置 colClasses。另一方面,让我感到困惑的是在其他情况下,它确实删除了前导零。所以我的问题是:在哪些情况下 read.csv 会删除前导零?

0 投票
0 回答
1515 浏览

r - R:多列的colClasses

我正在尝试在 read.csv 函数中设置 colClasses,并且我想将多个列设置为相同的类型。我尝试的是创建一个包含我想将类型设置为的列名称的向量,然后这样做:

但是,这总是会发出警告:警告消息:

我尝试输入列名,然后它就可以工作了。

任何帮助,将不胜感激!

另一方面,这是一个不相关的问题,但是有没有一种方法可以获取 .csv 文件中的列数,而无需实际读取它并使用 ncol?

0 投票
1 回答
366 浏览

r - 在 R 中使用 Æ 作为分隔符通过 source() 导入数据时出错

所以这对我来说是一个莫名其妙的错误,如果没有人有解释,我建议这是一个错误:

我有以下代码将文件导入R:

效果很好。我总是使用分隔符从 Access 导出数据,Æ因为它是一个很好的字符,不会出现在我的文件中。

现在对于错误:

当我使用代码创建一个新文件(“import.r”)时:

并在原始代码中使用源代码:

我得到错误:

有趣的是,如果我不使用Æ分隔符,但|在获取文件时它工作得很好。因此,错误显然是由Æ用作分隔符引起的(如错误中所述)。

但是,当直接调用相同的导入命令时,如何能够正常工作,但在通过调用时返回看似无关的错误source()

编辑:使用不同的编码读取字符会返回不同的结果:

正如詹姆斯在他的回答中建议的那样在代码中设置UTF-8编码奇怪地起作用并且文件被正确导入。

0 投票
4 回答
144 浏览

arrays - 使用数组读入(扫描,读取csv)R中的大量数据

任何人都可以帮助我了解如何在 R 中读取一个巨大的数据框(33 行,38 列,并且总是每 39 列以 # 从每日天气 1951-2015 开始的标题)。我在 .txt 文件中有以下数据命名它测试2.txt:

我正在尝试将其读入 R,然后创建一个数组或一个合理的矩阵来进行计算。我尝试使用 read.csv 和扫描,但我想我完全走错了路。有谁知道使用哪个命令。

此外,我想在之后为列和行添加名称,但这也可以在第二步中发生。名称应该用于行:A、B 和列 C、D、E、F、G,所以最后,数组看起来像我假设的名称(例如#1950-01-03 00:59 :00) 可能会丢失。

0 投票
1 回答
1022 浏览

r - 从R中的excel读取日期时间值

我有以下格式的专栏,

当我在 R 中阅读 usingread.csv时,它的内容如下,

问题是什么?如何以相同的格式阅读?

0 投票
1 回答
93 浏览

r - 重写一个函数,查找一组表中列的平均值,返回一些与旧程序一致的结果和一些略有不同的结果

我目前正在编写一个程序(完全公开,这是“家庭作业”)。该程序旨在根据给定的范围运行一系列文件,将它们整理到一个没有 NA 的大表中,并找到所提供污染物的平均值(这是表中的一列)。

我之前写过这个程序,但想尝试更多地划分功能,所以我重写了它。

奇怪的是,有些范围返回的结果与原始程序中的完全相同,而另一些则返回(相对)完全不同的结果。

例如:

污染物平均值(“规格数据”,“硫酸盐”,1:10)

旧程序:4.064128

新程序:4.064128


污染物平均值(“规格数据”,“硝酸盐”,23)

旧程序:1.280833

新程序:1.280833


污染物平均值(“规格数据”,“硝酸盐”,70:72)

旧程序:1.706047

新程序:1.732979


在最后一个示例中,旧程序产生了预期的结果,而新程序产生的结果根本不在可接受的误差范围内。


我简直不知所措,我一直在尝试重写我的新代码,以尽量减少与旧冷的差异,而不是简单地复制旧程序,而当前代码将在下面(与原始程序一起)。但是没有任何效果,尽管进行了很多更改,但我仍然收到完全相同的(坏)结果。


新程序:

旧程序

(这会产生更好的结果)

0 投票
2 回答
174 浏览

r - rbind 列表中的所有给定列

我正在将可变数量的 .csv 文件读取到一个列表中,这些文件都包含在当前工作目录中,并且希望 rbind 每个这些 .csv 文件的第二列。

工作目录中的文件如下所示:

我有以下代码将它们全部读入目录中任何给定数量文件的列表中:(代码来自这里

到目前为止,这工作得很好,我将所有数据放入一个漂亮的列表中:

现在我想在每个数据集的第二列上进行 rbind。下面的代码给了我一个只有第二列的列表(数据为了视觉目的而被缩写):

如何一次性将 rbind() 应用于所有这些?