“read.table”的相关标签问题

0 投票

1 回答

34294 浏览

r - R中read.table（）函数中的多个na.strings

我有一个方桌，它有两个 na.strings（例如“A”和“B”），我需要将它们变成 NA。到目前为止，我可以将其中任何一个变成 NA，但不能同时将两者都变成。我该怎么做？我可以在该参数中使用函数吗？如果是，我应该使用什么功能？我试过像 ( na.strings = "A" | "B") 和 ( na.strings = "A | B") 但它不起作用。我的代码如下：

r na read.table

2013-06-07T09:25:36.557

0 投票

2 回答

439 浏览

r - nrow() 给出的行数比 R 中的原始行数多

我有一个文件，第一行有 20 个字段作为标题。其余行的字段数不相等，有些行的列数比标题多。当我尝试使用 read.delim() 读取它时，它读取数据没有错误，但总行数超过了原始数。

以下是文件的几行：

文件中有 9 行。但是当在 R 中读取它并计算行数时，它显示为 12。

有人可以帮忙正确读取数据吗？

以下是 dput(data) 的输出

r read.table

2013-06-13T19:44:57.070

0 投票

2 回答

3375 浏览

r - read.table() 中的一个字节分隔符参数

我正在将不可预测的字符集字符串放入表中，并带有预期的列数。我在选择合适的分隔符时遇到了麻烦。

例如，示例表可能如下所示：

文件名：foo.txt

分隔符：“\u00AA”

ROW1,COL1: 富

ROW1,COL2: b,ar

ROW1,COL3: fo;obar

第 1 行，第 4 行：bo\tt

上。

在 RI 会给

read.table('foo.txt', sep="\u00AA")

并得到

无效的“sep”值：必须是一个字节

我应该使用什么分隔符来避免与不可预测的字符串发生冲突？Unicode 被接受到 \u007F，但 R 将任何更高的内容解释为多字节。为什么？

r read.table

2013-06-20T21:09:59.380

0 投票

1 回答

11122 浏览

r - 读取水平组织的 CSV 文件

在 R 中，是否有类似的函数read.csv读取标题在左侧（或右侧）而不是顶部的文件，并且数据从左到右组织？

所以数据看起来像：

查看read.tableand的文档read.csv，似乎没有弹出任何内容。我看到使用这些函数的最佳选择是使用read.table然后构造另一个表，其列是原始数据的行，依此类推。

r csv read.table

2013-06-25T02:30:42.003

0 投票

1 回答

224 浏览

r - 有没有办法将具有不同行长的 csv 文件扫描到列表中？

我有一个包含几百万行的 csv 文件。每行的长度可以在 5 到 10 之间。我可以通过使用read.table()NA 或空字符串将每行填充到长度 10 来读取数据，但是，稍后删除这些 NA 非常耗时。我想将文件读入向量列表，以便每一行都可以拥有自己的列表元素，从而无需使用 NA 或空字符串填充行。

r csv import read.table

2013-06-25T12:11:34.867

0 投票

1 回答

7733 浏览

r - 当列数未知时，使用 read.table 只读选择列

我想从许多文件中读取前 3 列，我不一定知道每个文件包含的列数。此外，我不完全知道每个文件中要跳过的行数，尽管在标题行之前不会超过 19 行。

我的问题类似于这些问题：

但是我有一个不同的问题，即不知道要导入的文件中的列数或要跳过的确切行数。我只想从每个文件中导入前三列，它们的名称一致（Date/Time, Unit, Value）。

链接问题的read.table解决方案需要知道文件中的列数并指定colClasses每列的列数。我正在尝试通过一种方法读取数千个文件lapply，其中输入是 .csv 文件的列表，并read.table在每个文件上使用：

有没有办法解决提前不知道列数的问题？

编辑：我已经修改了@asb 提供的答案以适应我的问题，并且效果很好。

r import read.table

2013-06-26T22:13:25.310

0 投票

2 回答

200 浏览

r - 在 R 中优化文件读取

我的 R 应用程序从大型 txt 文件中读取输入数据。它不会一次读取整个文件。用户指定基因的名称（一次 3 或 4 个）并根据用户输入，应用程序转到相应的行并读取数据。

文件格式：32,000 行（每行一个基因，前两列包含基因名称等信息） 35,000 列数字数据（十进制数）。

我使用 read.table (filename, skip=10,000 ) 等转到正确的行，然后读取 35,000 列数据。然后我对第 2 个基因、第 3 个基因（最多 4 个基因）再次执行此操作，然后处理数值结果。

文件读取操作大约需要 1.5 到 2.0 分钟。我正在尝试阅读整个文件，然后获取所需基因的数据。

有什么办法可以加速这个？如果将来可以加速读取操作，我可以以另一种格式（一次处理）重写基因数据。

r file-io read.table

2013-06-27T16:32:26.540

0 投票

3 回答

4355 浏览

r - R 列和 type.convert(data[[i]] 中的错误，特别是在 Mac 上

我正在尝试让 R 读取我的 CSV 文件（其中包含数字和分类数据）。我可以在 Windows 计算机上打开这个文件（我尝试了不同的，它总是有效）没有任何问题，但它根本不能在我的 Mac 上工作。我正在使用最新版本的 R。最初，数据在 Excel 中，然后我将其转换为 csv。

我已经用尽了所有选择，我尝试了类似主题的建议，但没有任何效果。有一次我有点成功，但结果看起来像这样：;32,0;K;;B;50;;;; 我尝试了本主题中给出的建议Import data into R with an unknown number of columns? 结果是一样的。我是 R 的初学者，我对编码或编程一无所知，所以我非常感谢任何关于这个问题的建议。以下是我解决这个问题的无能尝试：

这就是数据标题的样子。所以使用下面的建议，我将文档保存为 Mac 的 CSV 格式，一旦我执行 View(file) 函数，一切看起来都很好，除了下面的 row#1（Cord Number 1）这样的一些行，它完全错位：

这是电子表格在 Windows 上的 R Studio 中的样子（我没有足够的声誉来发布图片）：http: //imgur.com/zQdJBT2

r macos excel csv read.table

2013-06-28T02:53:45.287

0 投票

3 回答

510 浏览

r - R：读取数据框时识别列数

当在 R 中输入以下命令时，将创建一个 11 行和 5 列（变量）的数据框。我的问题是 R 怎么知道这个数据集中有 5 列？是什么阻止 R 创建 1 行 x 55 列数据框？

谢谢！

r dataframe read.table

2013-06-29T16:40:21.273

0 投票

2 回答

33719 浏览

r - R，使用read.csv一步读取字符作为数字？

我正在将 .csv 读入 R 中，其中有几种不同的变量类型，其中两种作为字符读入，尽管它们是数字的（以十进制度表示的纬度和经度）。为了解决这个问题，我在阅读它们后将它们定义为“as.numeric”。有没有更优雅的方法来做到这一点？也许在对“read.csv”的调用中？

r import read.table

2013-06-30T17:49:18.517

问题标签 [read.table]

Reference