问题标签 [read.table]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
34294 浏览

r - R中read.table()函数中的多个na.strings

我有一个方桌,它有两个 na.strings(例如“A”和“B”),我需要将它们变成 NA。到目前为止,我可以将其中任何一个变成 NA,但不能同时将两者都变成。我该怎么做?我可以在该参数中使用函数吗?如果是,我应该使用什么功能?我试过像 ( na.strings = "A" | "B") 和 ( na.strings = "A | B") 但它不起作用。我的代码如下:

0 投票
2 回答
439 浏览

r - nrow() 给出的行数比 R 中的原始行数多

我有一个文件,第一行有 20 个字段作为标题。其余行的字段数不相等,有些行的列数比标题多。当我尝试使用 read.delim() 读取它时,它读取数据没有错误,但总行数超过了原始数。

以下是文件的几行:

文件中有 9 行。但是当在 R 中读取它并计算行数时,它显示为 12。

有人可以帮忙正确读取数据吗?

以下是 dput(data) 的输出

0 投票
2 回答
3375 浏览

r - read.table() 中的一个字节分隔符参数

我正在将不可预测的字符集字符串放入表中,并带有预期的列数。我在选择合适的分隔符时遇到了麻烦。

例如,示例表可能如下所示:

文件名:foo.txt

分隔符:“\u00AA”

ROW1,COL1: 富

ROW1,COL2: b,ar

ROW1,COL3: fo;obar

第 1 行,第 4 行:bo\tt

上。

在 RI 会给

read.table('foo.txt', sep="\u00AA")

并得到

无效的“sep”值:必须是一个字节

我应该使用什么分隔符来避免与不可预测的字符串发生冲突?Unicode 被接受到 \u007F,但 R 将任何更高的内容解释为多字节。为什么?

0 投票
1 回答
11122 浏览

r - 读取水平组织的 CSV 文件

在 R 中,是否有类似的函数read.csv读取标题在左侧(或右侧)而不是顶部的文件,并且数据从左到右组织?

所以数据看起来像:

查看read.tableand的文档read.csv,似乎没有弹出任何内容。我看到使用这些函数的最佳选择是使用read.table然后构造另一个表,其列是原始数据的行,依此类推。

0 投票
1 回答
224 浏览

r - 有没有办法将具有不同行长的 csv 文件扫描到列表中?

我有一个包含几百万行的 csv 文件。每行的长度可以在 5 到 10 之间。我可以通过使用read.table()NA 或空字符串将每行填充到长度 10 来读取数据,但是,稍后删除这些 NA 非常耗时。我想将文件读入向量列表,以便每一行都可以拥有自己的列表元素,从而无需使用 NA 或空字符串填充行。

0 投票
1 回答
7733 浏览

r - 当列数未知时,使用 read.table 只读选择列

我想从许多文件中读取前 3 列,我不一定知道每个文件包含的列数。此外,我不完全知道每个文件中要跳过的行数,尽管在标题行之前不会超过 19 行。

我的问题类似于这些问题:

但是我有一个不同的问题,即不知道要导入的文件中的列数或要跳过的确切行数。我只想从每个文件中导入前三列,它们的名称一致(Date/Time, Unit, Value)。

链接问题的read.table解决方案需要知道文件中的列数并指定colClasses每列的列数。我正在尝试通过一种方法读取数千个文件lapply,其中输入是 .csv 文件的列表,并read.table在每个文件上使用:

有没有办法解决提前不知道列数的问题?

编辑:我已经修改了@asb 提供的答案以适应我的问题,并且效果很好。

0 投票
2 回答
200 浏览

r - 在 R 中优化文件读取

我的 R 应用程序从大型 txt 文件中读取输入数据。它不会一次读取整个文件。用户指定基因的名称(一次 3 或 4 个)并根据用户输入,应用程序转到相应的行并读取数据。

文件格式:32,000 行(每行一个基因,前两列包含基因名称等信息) 35,000 列数字数据(十进制数)。

我使用 read.table (filename, skip=10,000 ) 等转到正确的行,然后读取 35,000 列数据。然后我对第 2 个基因、第 3 个基因(最多 4 个基因)再次执行此操作,然后处理数值结果。

文件读取操作大约需要 1.5 到 2.0 分钟。我正在尝试阅读整个文件,然后获取所需基因的数据。

有什么办法可以加速这个?如果将来可以加速读取操作,我可以以另一种格式(一次处理)重写基因数据。

0 投票
3 回答
4355 浏览

r - R 列和 type.convert(data[[i]] 中的错误,特别是在 Mac 上

我正在尝试让 R 读取我的 CSV 文件(其中包含数字和分类数据)。我可以在 Windows 计算机上打开这个文件(我尝试了不同的,它总是有效)没有任何问题,但它根本不能在我的 Mac 上工作。我正在使用最新版本的 R。最初,数据在 Excel 中,然后我将其转换为 csv。

我已经用尽了所有选择,我尝试了类似主题的建议,但没有任何效果。有一次我有点成功,但结果看起来像这样:;32,0;K;;B;50;;;; 我尝试了本主题中给出的建议Import data into R with an unknown number of columns? 结果是一样的。我是 R 的初学者,我对编码或编程一无所知,所以我非常感谢任何关于这个问题的建议。以下是我解决这个问题的无能尝试:

这就是数据标题的样子。所以使用下面的建议,我将文档保存为 Mac 的 CSV 格式,一旦我执行 View(file) 函数,一切看起来都很好,除了下面的 row#1(Cord Number 1)这样的一些行,它完全错位:

这是电子表格在 Windows 上的 R Studio 中的样子(我没有足够的声誉来发布图片):http: //imgur.com/zQdJBT2

0 投票
3 回答
510 浏览

r - R:读取数据框时识别列数

当在 R 中输入以下命令时,将创建一个 11 行和 5 列(变量)的数据框。我的问题是 R 怎么知道这个数据集中有 5 列?是什么阻止 R 创建 1 行 x 55 列数据框?

谢谢!

0 投票
2 回答
33719 浏览

r - R,使用read.csv一步读取字符作为数字?

我正在将 .csv 读入 R 中,其中有几种不同的变量类型,其中两种作为字符读入,尽管它们是数字的(以十进制度表示的纬度和经度)。为了解决这个问题,我在阅读它们后将它们定义为“as.numeric”。有没有更优雅的方法来做到这一点?也许在对“read.csv”的调用中?