问题标签 [read.table]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
1295 浏览

r - 读取固定宽度格式,其中宽度是从列标题中推断出来的

我有一个相当奇怪的文件格式需要阅读。它有以空格分隔的列,但列宽必须从标题中推断出来。

此外,还有一些必须忽略的虚假行,包括空白行和非空白行。

数据的表示:

这里,第一列 ,col1包含从行首到文本字符串结尾的字符位置的文本col1。第二列col2包含从1in之后的下一个字符col1到文本字符串结尾的文本col2。等等。

实际上,有 17 列而不是 5 列,但这不应该改变代码。

我正在寻找包含以下内容的数据框:

这是一个相当不优雅的方法:

一定会有更好的办法。

要忽略的行是这个难题的一小部分。我将接受一种适用于已从文件中删除的解决方案(但当然更喜欢不需要预处理的解决方案)。

0 投票
1 回答
2591 浏览

r - 在 r 中使用 read.table 时,r 会给出一些空白单元格的 NA 值,而将其他单元格留空。有什么问题吗?

我正在将 csv 文件读入 r(带有blank.lines.skip=T选项)。它有一些字符、数字和因子变量。当 r 读入文件时,一些单元格被赋予 NA,而另一些则留空。似乎只有包含所有数字数据的列被赋予 NA 而包含其他类型数据的列被留空。我的数据集太大,无法手动检查所有这些。我的数据中有很多列和行,并且不确定为什么某些单元格获得 NA 而其他单元格没有,除非它是设计使然。任何建议表示赞赏。干杯。

0 投票
3 回答
10951 浏览

r - read.table 将“T”读为 TRUE,将“F”读为 FALSE,如何避免?

我有一个包含数据的文件c("A","T","B","F")

当我使用:

R将字符解释TTRUEFFALSE

我做错什么了吗?

0 投票
2 回答
112 浏览

r - 加载 15 列用空格分隔但最后一列包含空格的日志

我有一个日志文件,其中有 15 列以空格分隔,但日志文件中的最后一列是电子邮件主题行并包含空格。我不确定如何将这样的文件读入 R。最后一列如下所示:SUBJ:X XXX XXX XXX XXX XXX 我知道如何使用 read.table 读取以空格分隔的文件,但我不确定给定最后一列,该怎么办。

0 投票
1 回答
614 浏览

r - 下载的数据无法在 R 中读取

每当我使用所有形式的 getSymbols 和 get.hist.quote 命令时,都会出现错误。错误基本上是:

另一个例子:

所有来源和符号都在发生这种情况。我如何解决它??顺便说一句,相同的命令在其他计算机上工作得很好。使用的包:“quantmod”或“tseries”

运行评论中建议的调试器后,我得到:

0 投票
1 回答
1130 浏览

r - 更改 read.table 用于确定 R 中的列数的行数

?read.table指出:

我需要使用fill参数,我的一些 txt 文件可能在第 5 行之后具有列数最多的行。我不能使用标题,只是因为我没有它并且 col.names 将在导入后定义,所以我想将 R 使用的这 5 行更改为整个文件,(我没有请注意我能得到的任何速度损失)。有什么建议吗?谢谢!

编辑:

刚刚在代码中找到了这个read.table

我可以只更改5上述代码第 4 行中的数字吗?这会对read.table行为产生任何副作用吗?

编辑2:

我目前正在使用这种方法

拥有最大列数,并将结果创建为 dummy col.nameslike paste0("V", seq_len(maxCol))。你认为仍然值得拥有另一个read.table有可能选择它的人吗?

0 投票
2 回答
153 浏览

r - 如何从似乎将每一行存储为列表的站点创建数据框?

在此先感谢您的帮助。本质上,当我遇到这个时,我正在测试从网站上获取数据:http: //lib.stat.cmu.edu/datasets/sleep。我按照以下方式进行:

(A) 了解数据(在 R 中):我基本上输入了以下内容

(B) 我注意到我想要的数据确实从第 51 行开始,所以我编写了以下代码:

(C) 我收到以下错误:

我得到上述方法的地方来自另一个关于堆栈溢出的问题(将 dat 文件导入 R)。但是,这个问题涉及 .dat 文件,而我的问题是特定 URL 上的数据。我想知道的是如何将第 51 行的数据(如果您使用 readLines)获取到没有标题的数据框中(稍后我将使用 colnames(sleep_table) <- c("etc ."、"etc2"、"etc3"...)。

0 投票
3 回答
26368 浏览

windows - 无法将 unicode .csv 读入 R

我有一个 .csv 文件,其中包含以下数据:

我无法将其读入 R,以便列名像在文件中一样显示。

产生以下内容:

同时,在不指定 fileEncoding 的情况下执行相同操作会产生以下结果:

当我运行“文件”实用程序来找出文件的编码时,它说它是 UTF-8:

我正在使用 RStudio、Windows 7、R 版本 2.15.2、32 位。

提前致谢。

0 投票
2 回答
2850 浏览

r - 读取带有井号 (#) 分隔符的 txt 文件

我正在尝试读取大量以 R 分隔的哈希标记的 txt 文件。

例如:

当我尝试以下仅加载第一列时,可能是因为第一个哈希标记之后的所有内容都被解释为注释。

输出:

我不想用另一个字符更改每个文件中的哈希标记(我没有创建文件)。有人知道解决方法吗?

0 投票
1 回答
92 浏览

r - 如何读取列混乱的文件?

我有一个“\t”分隔的数据文件,如下所示:

在“价格”列中,一些数字包含逗号,看起来像“1,200”。某些行的“价格”列混乱,包含“未知”或其他没有“\t”且没有特定模式的内容。

如何阅读此文件,删除所有“价格”混乱的行,并删除数字中的所有逗号?我想要得到的是以下内容:

我试过使用

它不起作用,因为 scan() 期望“整数”但得到的不是整数。

任何人都可以帮忙吗?

提前致谢。