问题标签 [read.table]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
2 回答
1582 浏览

r - 读取具有不同行数的多个 CSV 文件以在文件开头跳过

我必须阅读大约 300 个单独的 CSV。我已经设法使用循环和结构化的 CSV 名称来自动化这个过程。然而,每个 CSV 在开始时都有 14-17 行垃圾,并且随机变化,因此在 read.table 命令中硬编码“跳过”参数将不起作用。每个 CSV 的列名和列数相同。

这是我所反对的一个例子:

基本上我想从行中读取VARIABLE,Min slice Y(m),Max slice Y(m),...。我可以想到一些解决方案,但我不知道如何对其进行编程。无论如何我可以:

  1. 首先阅读 CSV 并以某种方式计算出有多少行垃圾,然后重新阅读并指定要跳过的正确行数?或者
  2. 告诉read.table它在找到列名时开始阅读(因为这些对于每个 CSV 都是相同的)并忽略之前的所有内容?

我认为解决方案(2)是最合适的,但我愿意接受任何建议!

0 投票
2 回答
51 浏览

r - 提取相交元素的行号

我有两张桌子。我想从第二个表中提取一个列并将其传递到第一个表中。问题是,并非第二个表的列的所有行都应该被复制,而是只复制那些第一个列与第一个表匹配的行

只会导致一个带有 TRUE 和 FALSE 的向量 - 但我需要行号,然后有一个带有匹配元素的行号的向量,我需要从表 d 第四列中准确提取这些行

有简单的可能性吗?

0 投票
2 回答
2649 浏览

r - R - rbind 转置单列矩阵

我对 R 很陌生,但似乎这是一个我无法找到答案的特定问题。

我的程序读入一些数据,然后根据我传递的列号向量将该数据的某些列绑定到几个数据帧之一,所以是这样的:

我的问题在于只有一个所需列的情况,即 colVal 采用一个值。在这种情况下,我发现 InMat 基本上是从我所需要的转换而来的。更糟糕的是,当我读取多个文件时,它会绑定转置的所需列,因此我得到的行数等于我正在读取的文件数,列数与每个文件的每个所需列中的行数一样多。

似乎如果有 2 个所需的列(即 colVal 采用两个或多个值),那么它会按我的预期行事(即,一列被读取并作为一列存储在 InMat 中,每个附加文件的列存储在下面)。

我的问题是为什么 rbind 在只传递一个所需的列值时会有不同的行为,并且是否有一种简单的方法(读取;不添加一些笨拙的 if 或 for 循环来检查)来避免这种情况?

谢谢!

0 投票
1 回答
591 浏览

r - read.table 错误:相同的数据文件,但列号不匹配

我想为从文件中读取的数据表分配列名,但我收到一条对我来说不太有意义的错误消息。这是数据文件的摘录:

现在,我首先阅读了标题:

接下来,我将它用作 col.names 来读取表的其余部分,我想在其中使用 blood_title 变量作为列名:

不幸的是,我收到一条我不明白的错误消息:

为什么会出现这个错误?blood_title 中的表名和列名都包含 34 列:

编辑:

这是我在这个特定顺序中使用的完整代码

编辑2:

问题已解决,忘记取消引用变量 blood_title

0 投票
1 回答
1119 浏览

r - 在 R 的 read.table() 中指定多字符注释标记

是否可以在 R 中指定一个包含超过 1 个符号的注释字符?

例如,

不会工作。

0 投票
2 回答
546 浏览

r - 读表错误

我只需要从 .txt 文件中输入行的子集。我尝试使用 read.table 完成此操作,如下所示read.table(file.txt,header=TRUE,skip=200000,nrow=500):但是,生成的 data.frame 不包含适当的标题,而是 read.table 将第一行的值(即第 200,000 行)分配为列名。有没有办法解决这个问题?我意识到 R 将开始从 .txt 输入数据。文件位于第 200,000 行,并且 header=TRUE 假定第 200,000 行是数据帧的标题。但是,我希望第 1 行(已跳过)成为标题。任何帮助将不胜感激。

0 投票
3 回答
2041 浏览

r - 在 R 中跨多行的固定宽度文件中读取观察结果

我正在尝试读取 R 中的 dat 文件。数据可在此处获得。

有关数据集的规范可在此处获得。

我的问题的第一部分是通过使用该sep选项并提供有关每列开始位置的信息并提供na.strings="*". 但是,我不知道如何处理跨越超过 1 行的单个观察。

在这个数据集中,所有的观察跨越 2 行。

0 投票
1 回答
951 浏览

sql - 仅将 TSV 文件中的某些列名读入 R

我有一个非常大的 .TSV 文件,由于它的大小,我无法读入 R。

我只想按标题名称阅读选择列,例如。“健康”。

我该怎么做呢?

0 投票
2 回答
2085 浏览

r - R read.table 列向左移动

我创建了一个名为 test2.txt 的文件,其中包含以下信息:

使用以下命令读取时:

我得到以下信息:

列向左移动。是什么赋予了?!

我尝试了以下方法:

它告诉我标签的数量不同,但事实并非如此!我该如何处理这些信息?值得一提的是,当将此 .txt 文件导入 Excel 时,它会正确读取选项卡并且不会跳过或移动任何列。

我试图这样做分别分配列名,但这不起作用:

产量:

我在网上发现了一个类似的问题:https ://stat.ethz.ch/pipermail/r-help/2008-July/166676.html 。那个问题没有回答。

0 投票
3 回答
2733 浏览

r - 在R中读取ascii文件

我正在尝试使用 read.table 在 R 中读取文件 (ascii) 该文件如下所示:

我使用以下方法阅读它:

文件已被读取,内容在变量 inp 中。

我有2个问题-

I. 查看前 5 列的命令提供了一些额外的信息以及所需的输出,例如,inp[1,5] 提供以下输出:

我不想要额外的信息,只想要价值。我哪里错了?

二、在每 32 行之后,我有一个标题(YEAR DAY ....)。如何忽略定期阅读标题?