问题标签 [read.table]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - 读取固定宽度格式,其中宽度是从列标题中推断出来的
我有一个相当奇怪的文件格式需要阅读。它有以空格分隔的列,但列宽必须从标题中推断出来。
此外,还有一些必须忽略的虚假行,包括空白行和非空白行。
数据的表示:
这里,第一列 ,col1
包含从行首到文本字符串结尾的字符位置的文本col1
。第二列col2
包含从1
in之后的下一个字符col1
到文本字符串结尾的文本col2
。等等。
实际上,有 17 列而不是 5 列,但这不应该改变代码。
我正在寻找包含以下内容的数据框:
这是一个相当不优雅的方法:
一定会有更好的办法。
要忽略的行是这个难题的一小部分。我将接受一种适用于已从文件中删除的解决方案(但当然更喜欢不需要预处理的解决方案)。
r - 在 r 中使用 read.table 时,r 会给出一些空白单元格的 NA 值,而将其他单元格留空。有什么问题吗?
我正在将 csv 文件读入 r(带有blank.lines.skip=T
选项)。它有一些字符、数字和因子变量。当 r 读入文件时,一些单元格被赋予 NA,而另一些则留空。似乎只有包含所有数字数据的列被赋予 NA 而包含其他类型数据的列被留空。我的数据集太大,无法手动检查所有这些。我的数据中有很多列和行,并且不确定为什么某些单元格获得 NA 而其他单元格没有,除非它是设计使然。任何建议表示赞赏。干杯。
r - read.table 将“T”读为 TRUE,将“F”读为 FALSE,如何避免?
我有一个包含数据的文件c("A","T","B","F")
。
当我使用:
R将字符解释T
为TRUE
和F
FALSE
我做错什么了吗?
r - 加载 15 列用空格分隔但最后一列包含空格的日志
我有一个日志文件,其中有 15 列以空格分隔,但日志文件中的最后一列是电子邮件主题行并包含空格。我不确定如何将这样的文件读入 R。最后一列如下所示:SUBJ:X XXX XXX XXX XXX XXX 我知道如何使用 read.table 读取以空格分隔的文件,但我不确定给定最后一列,该怎么办。
r - 下载的数据无法在 R 中读取
每当我使用所有形式的 getSymbols 和 get.hist.quote 命令时,都会出现错误。错误基本上是:
另一个例子:
所有来源和符号都在发生这种情况。我如何解决它??顺便说一句,相同的命令在其他计算机上工作得很好。使用的包:“quantmod”或“tseries”
运行评论中建议的调试器后,我得到:
r - 更改 read.table 用于确定 R 中的列数的行数
中?read.table
指出:
我需要使用fill
参数,我的一些 txt 文件可能在第 5 行之后具有列数最多的行。我不能使用标题,只是因为我没有它并且 col.names 将在导入后定义,所以我想将 R 使用的这 5 行更改为整个文件,(我没有请注意我能得到的任何速度损失)。有什么建议吗?谢谢!
编辑:
刚刚在代码中找到了这个read.table
我可以只更改5
上述代码第 4 行中的数字吗?这会对read.table
行为产生任何副作用吗?
编辑2:
我目前正在使用这种方法
拥有最大列数,并将结果创建为 dummy col.names
like paste0("V", seq_len(maxCol))
。你认为仍然值得拥有另一个read.table
有可能选择它的人吗?
r - 如何从似乎将每一行存储为列表的站点创建数据框?
在此先感谢您的帮助。本质上,当我遇到这个时,我正在测试从网站上获取数据:http: //lib.stat.cmu.edu/datasets/sleep。我按照以下方式进行:
(A) 了解数据(在 R 中):我基本上输入了以下内容
(B) 我注意到我想要的数据确实从第 51 行开始,所以我编写了以下代码:
(C) 我收到以下错误:
我得到上述方法的地方来自另一个关于堆栈溢出的问题(将 dat 文件导入 R)。但是,这个问题涉及 .dat 文件,而我的问题是特定 URL 上的数据。我想知道的是如何将第 51 行的数据(如果您使用 readLines)获取到没有标题的数据框中(稍后我将使用 colnames(sleep_table) <- c("etc ."、"etc2"、"etc3"...)。
windows - 无法将 unicode .csv 读入 R
我有一个 .csv 文件,其中包含以下数据:
我无法将其读入 R,以便列名像在文件中一样显示。
产生以下内容:
同时,在不指定 fileEncoding 的情况下执行相同操作会产生以下结果:
当我运行“文件”实用程序来找出文件的编码时,它说它是 UTF-8:
我正在使用 RStudio、Windows 7、R 版本 2.15.2、32 位。
提前致谢。
r - 读取带有井号 (#) 分隔符的 txt 文件
我正在尝试读取大量以 R 分隔的哈希标记的 txt 文件。
例如:
当我尝试以下仅加载第一列时,可能是因为第一个哈希标记之后的所有内容都被解释为注释。
输出:
我不想用另一个字符更改每个文件中的哈希标记(我没有创建文件)。有人知道解决方法吗?
r - 如何读取列混乱的文件?
我有一个“\t”分隔的数据文件,如下所示:
在“价格”列中,一些数字包含逗号,看起来像“1,200”。某些行的“价格”列混乱,包含“未知”或其他没有“\t”且没有特定模式的内容。
如何阅读此文件,删除所有“价格”混乱的行,并删除数字中的所有逗号?我想要得到的是以下内容:
我试过使用
它不起作用,因为 scan() 期望“整数”但得到的不是整数。
任何人都可以帮忙吗?
提前致谢。