“read.table”的相关标签问题

0 投票

1 回答

1634 浏览

r - 为什么 write.csv 和 read.csv 不一致？

问题很简单，考虑下面的例子：

这样做的结果是它m1与原始对象的不同之处m在于它有一个名为“X”的新的第一列。如果我真的想让它们相等，我必须使用额外的参数，比如这两个例子：

或者

问题是，造成这种差异的原因是什么？特别是，为什么如果write.csv并且read.csv应该遵守 Excel 约定，为什么不导入最初导出的相同对象？对我来说，这是一种非常反直觉的行为，非常不受欢迎。

（如果我使用这些函数的 csv2 变体，结果完全一样）

提前致谢！

这些是 data.frames m，m1如果您不想使用 R 来查看示例：

2012-09-20T11:54:16.177

0 投票

1 回答

15430 浏览

r - 无法使用 R 中的 read.table 或 read.csv 读取带有“#”和空格的文件

我有一个文件，其中第一行是标题。标题可以有空格和# 符号（也可能有其他特殊字符）。我正在尝试使用 read.csv 或 read.table 读取此文件，但它不断向我抛出错误：

我的制表符分隔的 chromFile 文件如下所示：

命令：

我想首先寻找一种方法来读取文件，因为它不需要用其他可读符号替换空格或#。

r import read.table

2012-10-07T18:23:47.073

0 投票

2 回答

2165 浏览

r - R中的read.table和评论

我想将元数据作为评论添加到我的电子表格中，然后让 R 忽略这些。

我的数据是形式

（例外的是它更长。第一个评论实际上出现在前 5 行之外，用于scan确定列数）

我一直在尝试：

但是read.table（而且，就此而言，count.fields）认为我比实际拥有的领域多一个。我的数据框以一个名为“X”的空白列结束。我认为这是因为我的电子表格程序在每一行的末尾添加了逗号（如上例所示）。

使用flush=TRUE没有效果，即使（根据帮助文件）它“[...] 允许在最后一个字段 [...] 之后放置注释”

使用colClasses=c(rep(NA,3),NULL)也没有效果。

之后我可以删除该列，但由于这似乎是一种常见的做法，我想学习如何正确地做到这一点。

谢谢，

安德鲁

r metadata read.table

2012-10-07T18:44:32.380

0 投票

3 回答

36072 浏览

r - read.csv 与 read.table

我在几种情况下看到，虽然read.table()无法读取制表符分隔的文件（例如微阵列的注释表），但返回以下错误：

read.csv()在同一个文件上完美运行，没有错误。我认为也的速度read.csv()也高于read.table()。

甚至更多：read.table()正在做非常疯狂的阅读我的文件。它在读取第 100 行时出现此错误，但是当我将第 90 行到第 110 行复制并粘贴到同一文件的开头之后，它仍然会出现第 100+21 行的错误（在开头复制了新行）。如果该行有任何问题，为什么它在读取开头粘贴的行时不报告该错误？我确认read.csv()读取相同的文件没有错误。

您是否知道为什么read.table()无法读取在其上read.csv()工作的相同文件？还有任何理由read.table()在任何情况下使用吗？

r file-io read.table read.csv

2012-10-10T21:12:21.200

0 投票

4 回答

55713 浏览

r - 在 read.table/read.csv 中为 colClasses 参数指定自定义日期格式

问题：

在 read.table/read.csv 中使用 colClasses 参数时，有没有办法指定日期格式？

（我意识到我可以在导入后转换，但是有很多这样的日期列，在导入步骤中会更容易）

例子：

我有一个 .csv 格式的日期列%d/%m/%Y。

这会导致转换错误。例如，15/07/2008变成0015-07-20。

可重现的代码：

这是输出的样子：

代码输出

r date read.table read.csv

2012-10-23T01:22:20.340

0 投票

1 回答

4657 浏览

r - 导入和读取多个文件 R

我有许多名为“ abcd001.txt，abcd002.txt”的制表符分隔的.txt文件......存储在一个目录中。我可以使用以下代码导入它们（默认目录与数据文件目录相同）。它的三列，都是数字类型的数据

代码本身没有返回任何错误。我的疑问是如何访问正在加载的数据？如何访问说文件 abcd011.txt 的数据应该是三列数据

commands:names[3] 只返回文件号 000002 但没有数据。

此处的代码与此处的代码类似：将多个 CSV 文件读取到单独的数据帧中。

r plyr read.table

2012-10-29T12:12:12.903

0 投票

1 回答

6803 浏览

r - R中的read.table函数删除元素

可能重复：
无法读取带有“#”的文件和使用 R 中的 read.table 或 read.csv 的空间

R 的问题是，当我用 R 读入（使用read.table函数）分隔文件（例如制表符分隔的文本文件）时，包含#或'字符的行会被静默删除。应该如何读入文件以便不删除包含这些字符的行？

r comments read.table

2012-11-06T12:24:15.147

0 投票

1 回答

1610 浏览

r - 通过 lapply(FileList, read.xls) 读取数据时指定列类

我的问题是关于在读取来自许多文件的数据时如何为各种列指定类。更具体地说，我一次上传 1000 个 .xlsx 文件，并使用包read.xls()中的函数将它们转换为 .csv 文件gdata。

我的方法如下：

我很抱歉没有提供一个可行的例子。我不确定如何解决这个问题。

所有 .xlsx 文件都具有相同的标题和设置，但其中的数据帧中相应列的类Mylist并不完全相同。 有没有办法在我使用的方法中指定类？lapply() 我知道您可以扩展 to 的功能，read.table()但read.xls()我还没有弄清楚如何在lapply调用中正确指定列类。

r lapply read.table

2012-11-10T19:58:22.977

0 投票

2 回答

360 浏览

r - 导入其中某些列包含包含空格的字符串的数据集

我有一个如下所示的数据集：

实际数据集有 48 列和 50,000 行。

使用read.table()导入此数据集是有问题的，因为字符串“Blank screen”在两个子字符串之间有一个空格。例如，我收到如下错误消息：

我想知道是否有任何方法可以规避 R 中的这个问题，而不是更改 Excel 中的原始数据集。

编辑：只是补充一下，我尝试将填充设置为 TRUE，并在下面收到一条错误消息：

r dataframe read.table

2012-11-25T01:26:11.480

0 投票

1 回答

12889 浏览

r - 读取文件 - 警告信息

我有一个 22268 行乘 2521 列的文件。当我尝试使用这行代码读取文件时：

但我只读入 13024 行乘 2521 列，并出现以下错误：

警告消息：在 scan(file, what, nmax, sep, dec, quote, skip, nlines, na.strings, : 读取的项目数不是列数的倍数

我还使用此命令查看哪些行的列数不正确：

并取回了大约 20 行不正确的列表。

有没有办法用 NA 值填充这些行？

我认为这就是 read.table 函数中“填充”参数的作用，但事实并非如此。

或者

有没有办法忽略在“不正确”变量中标识的这些行？

r warnings read.table

2012-12-03T23:02:36.960

问题标签 [read.table]

问题：

例子：

可重现的代码：

Reference