问题标签 [read.table]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - 为什么 write.csv 和 read.csv 不一致?
问题很简单,考虑下面的例子:
这样做的结果是它m1
与原始对象的不同之处m
在于它有一个名为“X”的新的第一列。如果我真的想让它们相等,我必须使用额外的参数,比如这两个例子:
或者
问题是,造成这种差异的原因是什么?特别是,为什么如果write.csv
并且read.csv
应该遵守 Excel 约定,为什么不导入最初导出的相同对象?对我来说,这是一种非常反直觉的行为,非常不受欢迎。
(如果我使用这些函数的 csv2 变体,结果完全一样)
提前致谢!
这些是 data.frames m
,m1
如果您不想使用 R 来查看示例:
r - 无法使用 R 中的 read.table 或 read.csv 读取带有“#”和空格的文件
我有一个文件,其中第一行是标题。标题可以有空格和# 符号(也可能有其他特殊字符)。我正在尝试使用 read.csv 或 read.table 读取此文件,但它不断向我抛出错误:
我的制表符分隔的 chromFile 文件如下所示:
命令:
我想首先寻找一种方法来读取文件,因为它不需要用其他可读符号替换空格或#。
r - R中的read.table和评论
我想将元数据作为评论添加到我的电子表格中,然后让 R 忽略这些。
我的数据是形式
(例外的是它更长。第一个评论实际上出现在前 5 行之外,用于scan
确定列数)
我一直在尝试:
但是read.table
(而且,就此而言,count.fields
)认为我比实际拥有的领域多一个。我的数据框以一个名为“X”的空白列结束。我认为这是因为我的电子表格程序在每一行的末尾添加了逗号(如上例所示)。
使用flush=TRUE
没有效果,即使(根据帮助文件)它“[...] 允许在最后一个字段 [...] 之后放置注释”
使用colClasses=c(rep(NA,3),NULL)
也没有效果。
之后我可以删除该列,但由于这似乎是一种常见的做法,我想学习如何正确地做到这一点。
谢谢,
安德鲁
r - read.csv 与 read.table
我在几种情况下看到,虽然read.table()
无法读取制表符分隔的文件(例如微阵列的注释表),但返回以下错误:
read.csv()
在同一个文件上完美运行,没有错误。我认为也的速度read.csv()
也高于read.table()
。
甚至更多:read.table()
正在做非常疯狂的阅读我的文件。它在读取第 100 行时出现此错误,但是当我将第 90 行到第 110 行复制并粘贴到同一文件的开头之后,它仍然会出现第 100+21 行的错误(在开头复制了新行)。如果该行有任何问题,为什么它在读取开头粘贴的行时不报告该错误?我确认read.csv()
读取相同的文件没有错误。
您是否知道为什么read.table()
无法读取在其上read.csv()
工作的相同文件?还有任何理由read.table()
在任何情况下使用吗?
r - 在 read.table/read.csv 中为 colClasses 参数指定自定义日期格式
问题:
在 read.table/read.csv 中使用 colClasses 参数时,有没有办法指定日期格式?
(我意识到我可以在导入后转换,但是有很多这样的日期列,在导入步骤中会更容易)
例子:
我有一个 .csv 格式的日期列%d/%m/%Y
。
这会导致转换错误。例如,15/07/2008
变成0015-07-20
。
可重现的代码:
这是输出的样子:
r - 导入和读取多个文件 R
我有许多名为“ abcd001.txt,abcd002.txt”的制表符分隔的.txt文件......存储在一个目录中。我可以使用以下代码导入它们(默认目录与数据文件目录相同)。它的三列,都是数字类型的数据
代码本身没有返回任何错误。我的疑问是如何访问正在加载的数据?如何访问说文件 abcd011.txt 的数据应该是三列数据
commands:names[3] 只返回文件号 000002 但没有数据。
此处的代码与此处的代码类似:将多个 CSV 文件读取到单独的数据帧中。
r - R中的read.table函数删除元素
R 的问题是,当我用 R 读入(使用read.table
函数)分隔文件(例如制表符分隔的文本文件)时,包含#
或'
字符的行会被静默删除。应该如何读入文件以便不删除包含这些字符的行?
r - 通过 lapply(FileList, read.xls) 读取数据时指定列类
我的问题是关于在读取来自许多文件的数据时如何为各种列指定类。更具体地说,我一次上传 1000 个 .xlsx 文件,并使用包read.xls()
中的函数将它们转换为 .csv 文件gdata
。
我的方法如下:
我很抱歉没有提供一个可行的例子。我不确定如何解决这个问题。
所有 .xlsx 文件都具有相同的标题和设置,但其中的数据帧中相应列的类Mylist
并不完全相同。 有没有办法在我使用的方法中指定类?lapply()
我知道您可以扩展 to 的功能,read.table()
但read.xls()
我还没有弄清楚如何在lapply
调用中正确指定列类。
r - 导入其中某些列包含包含空格的字符串的数据集
我有一个如下所示的数据集:
实际数据集有 48 列和 50,000 行。
使用read.table()导入此数据集是有问题的,因为字符串“Blank screen”在两个子字符串之间有一个空格。例如,我收到如下错误消息:
我想知道是否有任何方法可以规避 R 中的这个问题,而不是更改 Excel 中的原始数据集。
编辑:只是补充一下,我尝试将填充设置为 TRUE,并在下面收到一条错误消息:
r - 读取文件 - 警告信息
我有一个 22268 行乘 2521 列的文件。当我尝试使用这行代码读取文件时:
但我只读入 13024 行乘 2521 列,并出现以下错误:
警告消息:在 scan(file, what, nmax, sep, dec, quote, skip, nlines, na.strings, : 读取的项目数不是列数的倍数
我还使用此命令查看哪些行的列数不正确:
并取回了大约 20 行不正确的列表。
有没有办法用 NA 值填充这些行?
我认为这就是 read.table 函数中“填充”参数的作用,但事实并非如此。
或者
有没有办法忽略在“不正确”变量中标识的这些行?