“read.table”的相关标签问题

0 投票

1 回答

1295 浏览

r - 读取固定宽度格式，其中宽度是从列标题中推断出来的

我有一个相当奇怪的文件格式需要阅读。它有以空格分隔的列，但列宽必须从标题中推断出来。

此外，还有一些必须忽略的虚假行，包括空白行和非空白行。

数据的表示：

这里，第一列 ,col1包含从行首到文本字符串结尾的字符位置的文本col1。第二列col2包含从1in之后的下一个字符col1到文本字符串结尾的文本col2。等等。

实际上，有 17 列而不是 5 列，但这不应该改变代码。

我正在寻找包含以下内容的数据框：

这是一个相当不优雅的方法：

一定会有更好的办法。

要忽略的行是这个难题的一小部分。我将接受一种适用于已从文件中删除的解决方案（但当然更喜欢不需要预处理的解决方案）。

r dataframe read.table

2013-04-19T01:04:06.713

0 投票

1 回答

2591 浏览

r - 在 r 中使用 read.table 时，r 会给出一些空白单元格的 NA 值，而将其他单元格留空。有什么问题吗？

我正在将 csv 文件读入 r（带有blank.lines.skip=T选项）。它有一些字符、数字和因子变量。当 r 读入文件时，一些单元格被赋予 NA，而另一些则留空。似乎只有包含所有数字数据的列被赋予 NA 而包含其他类型数据的列被留空。我的数据集太大，无法手动检查所有这些。我的数据中有很多列和行，并且不确定为什么某些单元格获得 NA 而其他单元格没有，除非它是设计使然。任何建议表示赞赏。干杯。

r read.table

2013-04-24T14:46:47.923

0 投票

3 回答

10951 浏览

r - read.table 将“T”读为 TRUE，将“F”读为 FALSE，如何避免？

我有一个包含数据的文件c("A","T","B","F")。

当我使用：

R将字符解释T为TRUE和FFALSE

我做错什么了吗？

r read.table

2013-04-25T12:14:49.927

0 投票

2 回答

112 浏览

r - 加载 15 列用空格分隔但最后一列包含空格的日志

我有一个日志文件，其中有 15 列以空格分隔，但日志文件中的最后一列是电子邮件主题行并包含空格。我不确定如何将这样的文件读入 R。最后一列如下所示：SUBJ:X XXX XXX XXX XXX XXX 我知道如何使用 read.table 读取以空格分隔的文件，但我不确定给定最后一列，该怎么办。

r shell logging csv read.table

2013-04-29T16:14:52.497

0 投票

1 回答

614 浏览

r - 下载的数据无法在 R 中读取

每当我使用所有形式的 getSymbols 和 get.hist.quote 命令时，都会出现错误。错误基本上是：

另一个例子：

所有来源和符号都在发生这种情况。我如何解决它？？顺便说一句，相同的命令在其他计算机上工作得很好。使用的包：“quantmod”或“tseries”

运行评论中建议的调试器后，我得到：

r read.table

2013-05-13T23:37:43.773

0 投票

1 回答

1130 浏览

r - 更改 read.table 用于确定 R 中的列数的行数

中?read.table指出：

我需要使用fill参数，我的一些 txt 文件可能在第 5 行之后具有列数最多的行。我不能使用标题，只是因为我没有它并且 col.names 将在导入后定义，所以我想将 R 使用的这 5 行更改为整个文件，（我没有请注意我能得到的任何速度损失）。有什么建议吗？谢谢！

编辑：

刚刚在代码中找到了这个read.table

我可以只更改5上述代码第 4 行中的数字吗？这会对read.table行为产生任何副作用吗？

编辑2：

我目前正在使用这种方法

拥有最大列数，并将结果创建为 dummy col.nameslike paste0("V", seq_len(maxCol))。你认为仍然值得拥有另一个read.table有可能选择它的人吗？

r read.table

2013-05-16T10:13:08.990

0 投票

2 回答

153 浏览

r - 如何从似乎将每一行存储为列表的站点创建数据框？

在此先感谢您的帮助。本质上，当我遇到这个时，我正在测试从网站上获取数据：http: //lib.stat.cmu.edu/datasets/sleep。我按照以下方式进行：

(A) 了解数据（在 R 中）：我基本上输入了以下内容

(B) 我注意到我想要的数据确实从第 51 行开始，所以我编写了以下代码：

(C) 我收到以下错误：

我得到上述方法的地方来自另一个关于堆栈溢出的问题（将 dat 文件导入 R）。但是，这个问题涉及 .dat 文件，而我的问题是特定 URL 上的数据。我想知道的是如何将第 51 行的数据（如果您使用 readLines）获取到没有标题的数据框中（稍后我将使用 colnames(sleep_table) <- c("etc ."、"etc2"、"etc3"...)。

r read.table

2013-05-29T16:36:24.353

0 投票

3 回答

26368 浏览

windows - 无法将 unicode .csv 读入 R

我有一个 .csv 文件，其中包含以下数据：

我无法将其读入 R，以便列名像在文件中一样显示。

产生以下内容：

同时，在不指定 fileEncoding 的情况下执行相同操作会产生以下结果：

当我运行“文件”实用程序来找出文件的编码时，它说它是 UTF-8：

我正在使用 RStudio、Windows 7、R 版本 2.15.2、32 位。

提前致谢。

windows r csv utf-8 read.table

2013-05-30T14:16:52.443

0 投票

2 回答

2850 浏览

r - 读取带有井号 (#) 分隔符的 txt 文件

我正在尝试读取大量以 R 分隔的哈希标记的 txt 文件。

例如：

当我尝试以下仅加载第一列时，可能是因为第一个哈希标记之后的所有内容都被解释为注释。

输出：

我不想用另一个字符更改每个文件中的哈希标记（我没有创建文件）。有人知道解决方法吗？

r read.table

2013-06-04T12:50:08.580

0 投票

1 回答

92 浏览

r - 如何读取列混乱的文件？

我有一个“\t”分隔的数据文件，如下所示：

在“价格”列中，一些数字包含逗号，看起来像“1,200”。某些行的“价格”列混乱，包含“未知”或其他没有“\t”且没有特定模式的内容。

如何阅读此文件，删除所有“价格”混乱的行，并删除数字中的所有逗号？我想要得到的是以下内容：

我试过使用

它不起作用，因为 scan() 期望“整数”但得到的不是整数。

任何人都可以帮忙吗？

提前致谢。

r read.table

2013-06-06T07:53:17.423

问题标签 [read.table]

Reference