问题标签 [readr]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - 无法使用 readr 阻止因子列中空单元格的 NA
我正在尝试读取带有一些空单元格的文件并获得预期的空单元格NA
。我有一些特殊的列,它们只能有值''
或'+'
. 所以我想通过使用将这些列设置为因子类
但是该列仍然NAs
在这些列中。readr_tsv
我可以通过更改参数来更改函数的全局行为na
,但这不是我想要的。我只想在特定列中更改它。
有没有办法将这些NAs
直接转换为''
?之后我肯定可以这样做,但我想知道我是否以错误的方式使用了这个东西。
编辑 这是一个测试文件
我如何实际上传文件?我只能附上图片...
r - dplyr:如何在跳过某些行的同时读取带有标题的 tsv 文件?
我有一个tsv
具有以下结构的简单文件:
我想阅读它,可能正在使用,readr::read_tsv
但这是问题所在。
如您所见,第一行包含标题。然后我有三行我不想读取它(它们包含一些来自 Apache PIG 的超级奇怪的数据),并且在第 4 行数据开始。在Pandas
,我会做类似的事情
这使我可以阅读标题并跳过第一、二、三行。
我没有看到类似的选项readr::read_tsv
。那是 :
df = read_tsv('/localpath/data.tsv', col_names = TRUE, skip = 4)
它不解析标题...
有任何想法吗?
r - 解析字符串向量中的德语数字
有一个字符串如下:
我想将其解析为
我试过:
我想出的唯一方法:
r - 如何使 R 的 read_csv2() 正确识别文本字符
尝试使用read_csv2()
from readr
package 读取 csv 文件。
问题是R 的默认值成功read_csv2()
识别时无法正确识别字符。read.csv2
例如:
原始值:KOZYATAĞI
如何read_csv2()
识别:KOZYATA<'d0'>I
我检查了帮助文件并尝试了下面列出的编码;但是无法实现。
第一次尝试:以错误的字符结束
第二次尝试:手动说明编码。
第三次尝试:由于上面的错误消息,对第二次尝试进行了补充。
这个没有给出错误,但仍然不能正确识别字符。
怎么做?让我知道是否需要任何其他信息。提前致谢。
r - Readr:read_csv 有特定日期时间的问题
我最近发现了提供 CSV 导出的芝加哥犯罪数据网站。使用 readr 导入 6.2M+ 记录后,我注意到无法读取时间在 12:00:00 PM 和 12:59:59 PM 之间的所有 Date 记录。
我使用以下导入:
问题()显示以下内容:
所有其他时间导入没有问题。
输入文件具有以下格式的日期字段:“04/06/2005 12:30:00 PM”。任何帮助或意见?(Windows 10 上的 R 3.3.2,最新包)
r - 如何使用 readr 读取没有年份的日期?
我有一个数据文件,其中给出的日期没有年份。
我试着这样读
但它接缝的是,readr 的日期解析器无法解析没有年份的日期。另一方面,lubridate 可以处理这样的日期:
有什么方法可以让读者阅读这些日期或使用 lubridate?
如果 readr 无法处理这样的“日期”或一年中的某一天,我将按以下方式使用 dplyr:
r - 如何编写 dplyr 组来分隔文件?
我正在尝试为使用 dplyr 的 group_by 函数分组的数据框中的每个组创建单独的 .csv 文件。到目前为止,我有类似的东西
正如预期的那样,这将写入一个仅包含最后一组数据的 .csv 文件。如何修改它以编写多个 .csv 文件,每个文件的文件名都包含 cyl?
r - 使用标题中带有数字符号的变量读取 csv 问题 [r]
我有一个与过去的问题类似的问题:如何将“数字符号-#”作为列标题的一部分阅读?
我也有一个英镑/哈希/数字符号作为 csv 文件中第一个变量的名称的一部分:“Seg#”
当我使用 readr 的“read_csv”读取 csv 时,我看到一条关于解析失败的警告消息,其中显示:预期 25 列,实际 26 列。它读入数据,但每列名称都向右移动,第一列数据(以前在变量“Seg#”下的数据)现在丢失了。
使用 read.csv 会产生相同的数据框,但没有任何警告。
我试图使用上面链接的问题中的建议来解决这个问题:
...但它只是做了同样的事情:删除第一列数据并将所有名称向右移动一次。
当我尝试“read.table”而不是 read.csv 时,我看到以下错误消息:
任何帮助将不胜感激!
编辑:包括数据示例
以下是数据在 Excel 中的外观:
然而,当读入 R 时,数据如下所示:
r - 忽略 readr::read_csv 中的尾随分隔符
当我使用 读取包含尾随分隔符的 CSV 文件时readr::read_csv
,我收到一条警告,指出已填写了缺少的列名。以下是重现此警告的简短示例 CSV 文件的内容(将以下代码段存储在名为 的文件中example.csv
):
请注意每行末尾的尾随逗号。现在如果我加载这个文件
我收到以下警告:
即使我只想显式加载 3 列
我仍然收到警告信息。
这是预期的行为还是有什么方法可以告诉read_csv
它应该忽略除我指定的列之外的所有列?还是有另一种方法来整理这个(显然格式错误的)CSV,以便删除/忽略尾随分隔符?
r - 无法接收所需的输出
我正在处理任务以读取 R Programming 中的固定宽度文件格式,这是我的数据集
http://www.cpc.ncep.noaa.gov/data/indices/wksst8110.for
我使用 readr 包读取文件并使用下面显示的代码清理数据
现在我得到了所需的 9 列,现在我的任务是找到第 4 列的总和,我的答案是 36540,但所需的答案是 32467,任何答案都将不胜感激,提前谢谢。