问题标签 [read.table]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - R中read.table()函数中的多个na.strings
我有一个方桌,它有两个 na.strings(例如“A”和“B”),我需要将它们变成 NA。到目前为止,我可以将其中任何一个变成 NA,但不能同时将两者都变成。我该怎么做?我可以在该参数中使用函数吗?如果是,我应该使用什么功能?我试过像 ( na.strings = "A" | "B"
) 和 ( na.strings = "A | B"
) 但它不起作用。我的代码如下:
r - nrow() 给出的行数比 R 中的原始行数多
我有一个文件,第一行有 20 个字段作为标题。其余行的字段数不相等,有些行的列数比标题多。当我尝试使用 read.delim() 读取它时,它读取数据没有错误,但总行数超过了原始数。
以下是文件的几行:
文件中有 9 行。但是当在 R 中读取它并计算行数时,它显示为 12。
有人可以帮忙正确读取数据吗?
以下是 dput(data) 的输出
r - read.table() 中的一个字节分隔符参数
我正在将不可预测的字符集字符串放入表中,并带有预期的列数。我在选择合适的分隔符时遇到了麻烦。
例如,示例表可能如下所示:
文件名:foo.txt
分隔符:“\u00AA”
ROW1,COL1: 富
ROW1,COL2: b,ar
ROW1,COL3: fo;obar
第 1 行,第 4 行:bo\tt
上。
在 RI 会给
read.table('foo.txt', sep="\u00AA")
并得到
无效的“sep”值:必须是一个字节
我应该使用什么分隔符来避免与不可预测的字符串发生冲突?Unicode 被接受到 \u007F,但 R 将任何更高的内容解释为多字节。为什么?
r - 读取水平组织的 CSV 文件
在 R 中,是否有类似的函数read.csv
读取标题在左侧(或右侧)而不是顶部的文件,并且数据从左到右组织?
所以数据看起来像:
查看read.table
and的文档read.csv
,似乎没有弹出任何内容。我看到使用这些函数的最佳选择是使用read.table
然后构造另一个表,其列是原始数据的行,依此类推。
r - 有没有办法将具有不同行长的 csv 文件扫描到列表中?
我有一个包含几百万行的 csv 文件。每行的长度可以在 5 到 10 之间。我可以通过使用read.table()
NA 或空字符串将每行填充到长度 10 来读取数据,但是,稍后删除这些 NA 非常耗时。我想将文件读入向量列表,以便每一行都可以拥有自己的列表元素,从而无需使用 NA 或空字符串填充行。
r - 当列数未知时,使用 read.table 只读选择列
我想从许多文件中读取前 3 列,我不一定知道每个文件包含的列数。此外,我不完全知道每个文件中要跳过的行数,尽管在标题行之前不会超过 19 行。
我的问题类似于这些问题:
但是我有一个不同的问题,即不知道要导入的文件中的列数或要跳过的确切行数。我只想从每个文件中导入前三列,它们的名称一致(Date/Time
, Unit
, Value
)。
链接问题的read.table
解决方案需要知道文件中的列数并指定colClasses
每列的列数。我正在尝试通过一种方法读取数千个文件lapply
,其中输入是 .csv 文件的列表,并read.table
在每个文件上使用:
有没有办法解决提前不知道列数的问题?
编辑:我已经修改了@asb 提供的答案以适应我的问题,并且效果很好。
r - 在 R 中优化文件读取
我的 R 应用程序从大型 txt 文件中读取输入数据。它不会一次读取整个文件。用户指定基因的名称(一次 3 或 4 个)并根据用户输入,应用程序转到相应的行并读取数据。
文件格式:32,000 行(每行一个基因,前两列包含基因名称等信息) 35,000 列数字数据(十进制数)。
我使用 read.table (filename, skip=10,000 ) 等转到正确的行,然后读取 35,000 列数据。然后我对第 2 个基因、第 3 个基因(最多 4 个基因)再次执行此操作,然后处理数值结果。
文件读取操作大约需要 1.5 到 2.0 分钟。我正在尝试阅读整个文件,然后获取所需基因的数据。
有什么办法可以加速这个?如果将来可以加速读取操作,我可以以另一种格式(一次处理)重写基因数据。
r - R 列和 type.convert(data[[i]] 中的错误,特别是在 Mac 上
我正在尝试让 R 读取我的 CSV 文件(其中包含数字和分类数据)。我可以在 Windows 计算机上打开这个文件(我尝试了不同的,它总是有效)没有任何问题,但它根本不能在我的 Mac 上工作。我正在使用最新版本的 R。最初,数据在 Excel 中,然后我将其转换为 csv。
我已经用尽了所有选择,我尝试了类似主题的建议,但没有任何效果。有一次我有点成功,但结果看起来像这样:;32,0;K;;B;50;;;; 我尝试了本主题中给出的建议Import data into R with an unknown number of columns? 结果是一样的。我是 R 的初学者,我对编码或编程一无所知,所以我非常感谢任何关于这个问题的建议。以下是我解决这个问题的无能尝试:
这就是数据标题的样子。所以使用下面的建议,我将文档保存为 Mac 的 CSV 格式,一旦我执行 View(file) 函数,一切看起来都很好,除了下面的 row#1(Cord Number 1)这样的一些行,它完全错位:
这是电子表格在 Windows 上的 R Studio 中的样子(我没有足够的声誉来发布图片):http: //imgur.com/zQdJBT2
r - R:读取数据框时识别列数
当在 R 中输入以下命令时,将创建一个 11 行和 5 列(变量)的数据框。我的问题是 R 怎么知道这个数据集中有 5 列?是什么阻止 R 创建 1 行 x 55 列数据框?
谢谢!
r - R,使用read.csv一步读取字符作为数字?
我正在将 .csv 读入 R 中,其中有几种不同的变量类型,其中两种作为字符读入,尽管它们是数字的(以十进制度表示的纬度和经度)。为了解决这个问题,我在阅读它们后将它们定义为“as.numeric”。有没有更优雅的方法来做到这一点?也许在对“read.csv”的调用中?