问题标签 [read.table]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
3 回答
5816 浏览

r - 将文件读入 data.frame 时自动检测日期列

读取文件时,该read.table函数用于type.convert区分逻辑、整数、数字、复数或因子列并相应地存储它们。

我想将日期添加到组合中,以便可以自动识别包含日期的列并将其解析为Date对象。应该只识别少数日期格式,例如

这是一个例子:

和输出

会给:

在我从头开始实施它之前,这样的东西是否已经在一个包中可用?或者也许有人已经尝试过(或将要)并愿意在这里分享他的代码?谢谢你。

0 投票
0 回答
666 浏览

r - read.csv 从第一列计数, read.table 和 read.delim 从第二列计数?

我对 R 完全陌生。我有一些脚本可以从 .cvs 文件中读取数据来绘制它们。他们阅读完整的表格并将数据绘制在特定列(例如第 6 列)中:

然后我将它们更改为从制表符分隔的文件中读取数据(使用read.delim和/或read.table)。

奇怪的是,现在列的编号发生了变化。“tabletab”中的第 6 列始终对应于“tablecsv”中的第 7 列。“tabletab”中的第 1 列将对应于“tablecsv”中的第 2 列。因此,似乎通过使用read.tableor read.delim,输入文件中的第一列被忽略或解释为注释。我似乎无法使用任何参数将其关闭。我试过设置skip = 0,但这并没有改变任何东西,无论如何都是默认参数。据我所知,第一列也不包含一个#字符,这是默认的注释符号。

有人对这种行为有解释吗?(我知道通过更改脚本中的列号来解决问题并不难。只是这种行为对我来说毫无意义)。

编辑:这里分别是 .csv 和 .tab 输入文件的前几行:

我的文件.csv:

我的文件.tab:

Edit2:这就是我的 tabletab 现在的样子:

现在好像还好。然而,这些来自我用 excel 重新保存的输入文件,在我稍微模糊了样本名称之后。原始文件产生的结果如下所示:

tabletab1[1:3,] name A xxx_NODE_25653_yyy_272_zzz_2.529412_1_312_- 0.2427184 0.35483871 xxx_NODE_22738_yyy_415_zzz_2.453012_1_455_+ 0.1523179 0.18750000 xxx_NODE_52133_yyy_348_zzz_3.123563_1_388_- 0.1240310 0.06666667 B xxx_NODE_25653_yyy_272_zzz_2.529412_1_312_- 0.1666667 xxx_NODE_22738_yyy_415_zzz_2.453012_1_455_+ 0.2142857 xxx_NODE_52133_yyy_348_zzz_3.123563_1_388_- 0.1000000 C xxx_NODE_25653_yyy_272_zzz_2.529412_1_312_- 0.2000000 xxx_NODE_22738_yyy_415_zzz_2 .453012_1_455_+ 0.1208791 xxx_NODE_52133_yyy_348_zzz_3.123563_1_388_- 0.1518987

因此,“名称”列包含在所有其他列中。包含的这些文件是使用在 unix 下运行的 java 程序生成的,该程序似乎使用其他元字符来表示“\t”和“\n”(在文本编辑器中看不到这个)所以问题解决了,我猜,但是因为我在unix机器上运行java程序,如果在windows操作系统上使用Excel重新保存表格后发现表格工作得更好,并且在unix机器上也运行R?此外,当我在任何表上运行 Dos2Unix 时,它们会再次获得这些元字符,从而导致这些问题。

0 投票
1 回答
303 浏览

r - SAS' MISSOVER 用于 R 中的数据输入

我有一个包含 7 列的数据文件 A,没有缺失值,我将join一个包含 28 个字段的数据文件 B 统一到该文件中。结果文件是 C。如果在 B 中没有找到匹配项,则 C 中的输出行只有 7 列。如果 B 中有匹配项,则 C 中的输出行有 35 列。我已经选择了填补缺失的 28 个字段,但没有成功join-e

我正在尝试做的是MISSOVER在 R 中复制 SAS 的输入语句。例如,以下代码可以完美运行:

但是当我尝试加载我的 C 文件时,我收到以下错误(使用TRUE而不是T):

第一行(C 中的第二行,在标题之后)确实只有 A 中的 7 个字段。在 SAS 中,我会使用该MISSOVER语句将所有那些尾随缺失的字段设置为某个缺失值。我怎么能在 R 中做到这一点?谢谢。

0 投票
2 回答
2684 浏览

r - 如何在 R 中的 read.csv 中指定分类变量的排序

我正在使用该read.csv函数和colClasses参数来读取我的 csv 文件。我想要实现的是,对于所有colClasses“因素”,我想指定因素的顺序。即

如果“液体类型”列具有以下因素:-“水”、“果汁”、“苏打水”、“酒精”,我想控制因素的顺序。让我们说

那么我怎样才能控制因素的顺序read.csv呢?

编辑:您在下面的评论,格式为:

0 投票
5 回答
47863 浏览

r - 如何在 R 中读取具有不同列数的 CSV 文件

我有一个稀疏数据集,其列数的长度不同,采用 csv 格式。这是文件文本的示例。

当我使用

R 会将数据集解释为具有 3 列,因为大小是从前 5 行确定的。无论如何强制 r 将数据放在更多列中?

0 投票
3 回答
1288 浏览

r - 将原始数据导入 R

请任何人都可以帮助我将这些数据从文本或 dat 文件导入 R。它有空格分隔,但城市名称不应视为两个名称。就像纽约一样。

0 投票
0 回答
159 浏览

r - 如何从行中读取和构造 txt 文件,然后将它们作为变量分配给列?

我在构建 txt 数据集时遇到问题,该数据集是关于来自不同领域和时间的新闻,如下所示:

现在我正在尝试使用 R 将此数据集作为列中的不同变量读取。每一行的第一行是“Topic”,然后是“Description”、“Link”、“ID”、“Data&Time”、“City”,最后一行是“Fields”。该文件包含数千行,其中许多行缺少变量。

我真的不知道从哪里以及如何开始。希望任何人都可以帮助我!

0 投票
1 回答
156 浏览

r - 如何让R读取数据以“|**|”分隔

我有一个大型数据集,其中的变量由符号分隔|**|。我尝试使用sep="|",但是当字符串变量之一包含|. 如何使 R 使用复合分隔符读取数据?

0 投票
1 回答
833 浏览

r - 以空单元格读取文本为 NA

假设 a 有一个由字符串组成的向量,就像这样:

我想把它读成data.frame6 行 9 列,像这样:

其中每个空单元格被视为NA. 我试过 useread.table和 setting fill=TRUE,但它不起作用,因为结果是这样的:

我坚持这一点。也许这比我想象的要容易,但我不知道该怎么做:(

这是数据:

0 投票
1 回答
1504 浏览

r - 从 R 中的表中读取自定义 DateTime 时出错

我想这样做:在 read.table/read.csv 中为 colClasses 参数指定自定义日期格式

我在 csv 中的 DateTime 字符串的格式为“2010-08-18T09:50:00.000+02:00”。最后一部分是与 GMT 的区别。

所以我调整了上面问题中给出的解决方案:

到目前为止一切正常:

但是当尝试从 csv 文件中读取数据时,会出现错误:

我无法找出错误来自哪里。你能帮助我吗?