“read.table”的相关标签问题

0 投票

3 回答

5816 浏览

r - 将文件读入 data.frame 时自动检测日期列

读取文件时，该read.table函数用于type.convert区分逻辑、整数、数字、复数或因子列并相应地存储它们。

我想将日期添加到组合中，以便可以自动识别包含日期的列并将其解析为Date对象。应该只识别少数日期格式，例如

这是一个例子：

和输出

会给：

在我从头开始实施它之前，这样的东西是否已经在一个包中可用？或者也许有人已经尝试过（或将要）并愿意在这里分享他的代码？谢谢你。

r date read.table

2013-08-22T20:57:08.503

0 投票

0 回答

666 浏览

r - read.csv 从第一列计数， read.table 和 read.delim 从第二列计数？

我对 R 完全陌生。我有一些脚本可以从 .cvs 文件中读取数据来绘制它们。他们阅读完整的表格并将数据绘制在特定列（例如第 6 列）中：

然后我将它们更改为从制表符分隔的文件中读取数据（使用read.delim和/或read.table）。

奇怪的是，现在列的编号发生了变化。“tabletab”中的第 6 列始终对应于“tablecsv”中的第 7 列。“tabletab”中的第 1 列将对应于“tablecsv”中的第 2 列。因此，似乎通过使用read.tableor read.delim，输入文件中的第一列被忽略或解释为注释。我似乎无法使用任何参数将其关闭。我试过设置skip = 0，但这并没有改变任何东西，无论如何都是默认参数。据我所知，第一列也不包含一个#字符，这是默认的注释符号。

有人对这种行为有解释吗？（我知道通过更改脚本中的列号来解决问题并不难。只是这种行为对我来说毫无意义）。

编辑：这里分别是 .csv 和 .tab 输入文件的前几行：

我的文件.csv：

我的文件.tab：

Edit2：这就是我的 tabletab 现在的样子：

现在好像还好。然而，这些来自我用 excel 重新保存的输入文件，在我稍微模糊了样本名称之后。原始文件产生的结果如下所示：

tabletab1[1:3,] name A xxx_NODE_25653_yyy_272_zzz_2.529412_1_312_- 0.2427184 0.35483871 xxx_NODE_22738_yyy_415_zzz_2.453012_1_455_+ 0.1523179 0.18750000 xxx_NODE_52133_yyy_348_zzz_3.123563_1_388_- 0.1240310 0.06666667 B xxx_NODE_25653_yyy_272_zzz_2.529412_1_312_- 0.1666667 xxx_NODE_22738_yyy_415_zzz_2.453012_1_455_+ 0.2142857 xxx_NODE_52133_yyy_348_zzz_3.123563_1_388_- 0.1000000 C xxx_NODE_25653_yyy_272_zzz_2.529412_1_312_- 0.2000000 xxx_NODE_22738_yyy_415_zzz_2 .453012_1_455_+ 0.1208791 xxx_NODE_52133_yyy_348_zzz_3.123563_1_388_- 0.1518987

因此，“名称”列包含在所有其他列中。包含的这些文件是使用在 unix 下运行的 java 程序生成的，该程序似乎使用其他元字符来表示“\t”和“\n”（在文本编辑器中看不到这个）所以问题解决了，我猜，但是因为我在unix机器上运行java程序，如果在windows操作系统上使用Excel重新保存表格后发现表格工作得更好，并且在unix机器上也运行R？此外，当我在任何表上运行 Dos2Unix 时，它们会再次获得这些元字符，从而导致这些问题。

r csv read.table

2013-09-16T09:32:51.587

0 投票

1 回答

303 浏览

r - SAS' MISSOVER 用于 R 中的数据输入

我有一个包含 7 列的数据文件 A，没有缺失值，我将join一个包含 28 个字段的数据文件 B 统一到该文件中。结果文件是 C。如果在 B 中没有找到匹配项，则 C 中的输出行只有 7 列。如果 B 中有匹配项，则 C 中的输出行有 35 列。我已经选择了填补缺失的 28 个字段，但没有成功join。-e

我正在尝试做的是MISSOVER在 R 中复制 SAS 的输入语句。例如，以下代码可以完美运行：

但是当我尝试加载我的 C 文件时，我收到以下错误（使用TRUE而不是T）：

第一行（C 中的第二行，在标题之后）确实只有 A 中的 7 个字段。在 SAS 中，我会使用该MISSOVER语句将所有那些尾随缺失的字段设置为某个缺失值。我怎么能在 R 中做到这一点？谢谢。

r read.table

2013-09-18T17:50:26.017

0 投票

2 回答

2684 浏览

r - 如何在 R 中的 read.csv 中指定分类变量的排序

我正在使用该read.csv函数和colClasses参数来读取我的 csv 文件。我想要实现的是，对于所有colClasses“因素”，我想指定因素的顺序。即

如果“液体类型”列具有以下因素：-“水”、“果汁”、“苏打水”、“酒精”，我想控制因素的顺序。让我们说

那么我怎样才能控制因素的顺序read.csv呢？

编辑：您在下面的评论，格式为：

r read.table

2013-09-18T19:18:30.250

0 投票

5 回答

47863 浏览

r - 如何在 R 中读取具有不同列数的 CSV 文件

我有一个稀疏数据集，其列数的长度不同，采用 csv 格式。这是文件文本的示例。

当我使用

R 会将数据集解释为具有 3 列，因为大小是从前 5 行确定的。无论如何强制 r 将数据放在更多列中？

r csv import read.table sparse-columns

2013-09-20T17:24:26.260

0 投票

3 回答

1288 浏览

r - 将原始数据导入 R

请任何人都可以帮助我将这些数据从文本或 dat 文件导入 R。它有空格分隔，但城市名称不应视为两个名称。就像纽约一样。

r import read.table

2013-09-22T06:46:20.390

0 投票

0 回答

159 浏览

r - 如何从行中读取和构造 txt 文件，然后将它们作为变量分配给列？

我在构建 txt 数据集时遇到问题，该数据集是关于来自不同领域和时间的新闻，如下所示：

现在我正在尝试使用 R 将此数据集作为列中的不同变量读取。每一行的第一行是“Topic”，然后是“Description”、“Link”、“ID”、“Data&Time”、“City”，最后一行是“Fields”。该文件包含数千行，其中许多行缺少变量。

我真的不知道从哪里以及如何开始。希望任何人都可以帮助我！

r read.table

2013-09-28T04:48:55.867

0 投票

1 回答

156 浏览

r - 如何让R读取数据以“|**|”分隔

我有一个大型数据集，其中的变量由符号分隔|**|。我尝试使用sep="|"，但是当字符串变量之一包含|. 如何使 R 使用复合分隔符读取数据？

r read.table

2013-09-30T06:33:33.860

0 投票

1 回答

833 浏览

r - 以空单元格读取文本为 NA

假设 a 有一个由字符串组成的向量，就像这样：

我想把它读成data.frame6 行 9 列，像这样：

其中每个空单元格被视为NA. 我试过 useread.table和 setting fill=TRUE，但它不起作用，因为结果是这样的：

我坚持这一点。也许这比我想象的要容易，但我不知道该怎么做:(

这是数据：

r read.table

2013-10-15T21:20:35.093

0 投票

1 回答

1504 浏览

r - 从 R 中的表中读取自定义 DateTime 时出错

我想这样做：在 read.table/read.csv 中为 colClasses 参数指定自定义日期格式

我在 csv 中的 DateTime 字符串的格式为“2010-08-18T09:50:00.000+02:00”。最后一部分是与 GMT 的区别。

所以我调整了上面问题中给出的解决方案：

到目前为止一切正常：

但是当尝试从 csv 文件中读取数据时，会出现错误：

我无法找出错误来自哪里。你能帮助我吗？

r datetime csv timezone read.table

2013-10-16T02:14:08.610

问题标签 [read.table]

Reference