问题标签 [read.table]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
1634 浏览

r - 为什么 write.csv 和 read.csv 不一致?

问题很简单,考虑下面的例子:

这样做的结果是它m1与原始对象的不同之处m在于它有一个名为“X”的新的第一列。如果我真的想让它们相等,我必须使用额外的参数,比如这两个例子:

或者

问题是,造成这种差异的原因是什么?特别是,为什么如果write.csv并且read.csv应该遵守 Excel 约定,为什么不导入最初导出的相同对象?对我来说,这是一种非常反直觉的行为,非常不受欢迎。

(如果我使用这些函数的 csv2 变体,结果完全一样)

提前致谢!


这些是 data.frames mm1如果您不想使用 R 来查看示例:

0 投票
1 回答
15430 浏览

r - 无法使用 R 中的 read.table 或 read.csv 读取带有“#”和空格的文件

我有一个文件,其中第一行是标题。标题可以有空格和# 符号(也可能有其他特殊字符)。我正在尝试使用 read.csv 或 read.table 读取此文件,但它不断向我抛出错误:

我的制表符分隔的 chromFile 文件如下所示:

命令:

我想首先寻找一种方法来读取文件,因为它不需要用其他可读符号替换空格或#。

0 投票
2 回答
2165 浏览

r - R中的read.table和评论

我想将元数据作为评论添加到我的电子表格中,然后让 R 忽略这些。

我的数据是形式

(例外的是它更长。第一个评论实际上出现在前 5 行之外,用于scan确定列数)

我一直在尝试:

但是read.table(而且,就此而言,count.fields)认为我比实际拥有的领域多一个。我的数据框以一个名为“X”的空白列结束。我认为这是因为我的电子表格程序在每一行的末尾添加了逗号(如上例所示)。

使用flush=TRUE没有效果,即使(根据帮助文件)它“[...] 允许在最后一个字段 [...] 之后放置注释”

使用colClasses=c(rep(NA,3),NULL)也没有效果。

之后我可以删除该列,但由于这似乎是一种常见的做法,我想学习如何正确地做到这一点。

谢谢,

安德鲁

0 投票
3 回答
36072 浏览

r - read.csv 与 read.table

我在几种情况下看到,虽然read.table()无法读取制表符分隔的文件(例如微阵列的注释表),但返回以下错误:

read.csv()在同一个文件上完美运行,没有错误。我认为也的速度read.csv()也高于read.table()

甚至更多:read.table()正在做非常疯狂的阅读我的文件。它在读取第 100 行时出现此错误,但是当我将第 90 行到第 110 行复制并粘贴到同一文件的开头之后,它仍然会出现第 100+21 行的错误(在开头复制了新行)。如果该行有任何问题,为什么它在读取开头粘贴的行时不报告该错误?我确认read.csv()读取相同的文件没有错误。

您是否知道为什么read.table()无法读取在其上read.csv()工作的相同文件?还有任何理由read.table()在任何情况下使用吗?

0 投票
4 回答
55713 浏览

r - 在 read.table/read.csv 中为 colClasses 参数指定自定义日期格式

问题:

在 read.table/read.csv 中使用 colClasses 参数时,有没有办法指定日期格式?

(我意识到我可以在导入后转换,但是有很多这样的日期列,在导入步骤中会更容易)


例子:

我有一个 .csv 格式的日期列%d/%m/%Y

这会导致转换错误。例如,15/07/2008变成0015-07-20


可重现的代码:

这是输出的样子:

代码输出

0 投票
1 回答
4657 浏览

r - 导入和读取多个文件 R

我有许多名为“ abcd001.txt,abcd002.txt”的制表符分隔的.txt文件......存储在一个目录中。我可以使用以下代码导入它们(默认目录与数据文件目录相同)。它的三列,都是数字类型的数据

代码本身没有返回任何错误。我的疑问是如何访问正在加载的数据?如何访问说文件 abcd011.txt 的数据应该是三列数据

commands:names[3] 只返回文件号 000002 但没有数据。

此处的代码与此处的代码类似:将多个 CSV 文件读取到单独的数据帧中。

0 投票
1 回答
6803 浏览

r - R中的read.table函数删除元素

可能重复:
无法读取带有“#”的文件和使用 R 中的 read.table 或 read.csv 的空间

R 的问题是,当我用 R 读入(使用read.table函数)分隔文件(例如制表符分隔的文本文件)时,包含#'字符的行会被静默删除。应该如何读入文件以便不删除包含这些字符的行?

0 投票
1 回答
1610 浏览

r - 通过 lapply(FileList, read.xls) 读取数据时指定列类

我的问题是关于在读取来自许多文件的数据时如何为各种列指定类。更具体地说,我一次上传 1000 个 .xlsx 文件,并使用包read.xls()中的函数将它们转换为 .csv 文件gdata

我的方法如下:

我很抱歉没有提供一个可行的例子。我不确定如何解决这个问题。

所有 .xlsx 文件都具有相同的标题和设置,但其中的数据帧中相应列的类Mylist并不完全相同。 有没有办法在我使用的方法中指定类?lapply() 我知道您可以扩展 to 的功能,read.table()read.xls()我还没有弄清楚如何在lapply调用中正确指定列类。

0 投票
2 回答
360 浏览

r - 导入其中某些列包含包含空格的字符串的数据集

我有一个如下所示的数据集:

实际数据集有 48 列和 50,000 行。

使用read.table()导入此数据集是有问题的,因为字符串“Blank screen”在两个子字符串之间有一个空格。例如,我收到如下错误消息:

我想知道是否有任何方法可以规避 R 中的这个问题,而不是更改 Excel 中的原始数据集。

编辑:只是补充一下,我尝试将填充设置为 TRUE,并在下面收到一条错误消息:

0 投票
1 回答
12889 浏览

r - 读取文件 - 警告信息

我有一个 22268 行乘 2521 列的文件。当我尝试使用这行代码读取文件时:

但我只读入 13024 行乘 2521 列,并出现以下错误:

警告消息:在 scan(file, what, nmax, sep, dec, quote, skip, nlines, na.strings, : 读取的项目数不是列数的倍数

我还使用此命令查看哪些行的列数不正确:

并取回了大约 20 行不正确的列表。

有没有办法用 NA 值填充这些行?

我认为这就是 read.table 函数中“填充”参数的作用,但事实并非如此。

或者

有没有办法忽略在“不正确”变量中标识的这些行?