问题标签 [readr]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
3 回答
226 浏览

r - 无法使用 readr 阻止因子列中空单元格的 NA

我正在尝试读取带有一些空单元格的文件并获得预期的空单元格NA。我有一些特殊的列,它们只能有值'''+'. 所以我想通过使用将这些列设置为因子类

但是该列仍然NAs在这些列中。readr_tsv我可以通过更改参数来更改函数的全局行为na,但这不是我想要的。我只想在特定列中更改它。

有没有办法将这些NAs直接转换为''?之后我肯定可以这样做,但我想知道我是否以错误的方式使用了这个东西。

编辑 这是一个测试文件

我如何实际上传文件?我只能附上图片...

0 投票
1 回答
2967 浏览

r - dplyr:如何在跳过某些行的同时读取带有标题的 tsv 文件?

我有一个tsv具有以下结构的简单文件:

我想阅读它,可能正在使用,readr::read_tsv但这是问题所在。

如您所见,第一行包含标题。然后我有三行我不想读取它(它们包含一些来自 Apache PIG 的超级奇怪的数据),并且在第 4 行数据开始Pandas,我会做类似的事情

这使我可以阅读标题跳过第一、二、三行。

我没有看到类似的选项readr::read_tsv。那是 :

df = read_tsv('/localpath/data.tsv', col_names = TRUE, skip = 4)

它不解析标题...

有任何想法吗?

0 投票
1 回答
84 浏览

r - 解析字符串向量中的德语数字

有一个字符串如下:

我想将其解析为

我试过:

我想出的唯一方法:

0 投票
2 回答
5559 浏览

r - 如何使 R 的 read_csv2() 正确识别文本字符

尝试使用read_csv2()from readrpackage 读取 csv 文件。

问题是R 的默认值成功read_csv2()识别时无法正确识别字符。read.csv2

例如:

原始值:KOZYATAĞI

如何read_csv2()识别:KOZYATA<'d0'>I

我检查了帮助文件并尝试了下面列出的编码;但是无法实现。

第一次尝试:以错误的字符结束

第二次尝试:手动说明编码。

第三次尝试:由于上面的错误消息,对第二次尝试进行了补充。

这个没有给出错误,但仍然不能正确识别字符。

怎么做?让我知道是否需要任何其他信息。提前致谢。

0 投票
1 回答
1379 浏览

r - Readr:read_csv 有特定日期时间的问题

我最近发现了提供 CSV 导出的芝加哥犯罪数据网站。使用 readr 导入 6.2M+ 记录后,我注意到无法读取时间在 12:00:00 PM 和 12:59:59 PM 之间的所有 Date 记录。

我使用以下导入:

问题()显示以下内容:

所有其他时间导入没有问题。

输入文件具有以下格式的日期字段:“04/06/2005 12:30:00 PM”。任何帮助或意见?(Windows 10 上的 R 3.3.2,最新包)

0 投票
1 回答
499 浏览

r - 如何使用 readr 读取没有年份的日期?

我有一个数据文件,其中给出的日期没有年份。

我试着这样读

但它接缝的是,readr 的日期解析器无法解析没有年份的日期。另一方面,lubridate 可以处理这样的日期:

有什么方法可以让读者阅读这些日期或使用 lubridate?

如果 readr 无法处理这样的“日期”或一年中的某一天,我将按以下方式使用 dplyr:

0 投票
4 回答
5590 浏览

r - 如何编写 dplyr 组来分隔文件?

我正在尝试为使用 dplyr 的 group_by 函数分组的数据框中的每个组创建单独的 .csv 文件。到目前为止,我有类似的东西

正如预期的那样,这将写入一个仅包含最后一组数据的 .csv 文件。如何修改它以编写多个 .csv 文件,每个文件的文件名都包含 cyl?

0 投票
1 回答
375 浏览

r - 使用标题中带有数字符号的变量读取 csv 问题 [r]

我有一个与过去的问题类似的问题:如何将“数字符号-#”作为列标题的一部分阅读?

我也有一个英镑/哈希/数字符号作为 csv 文件中第一个变量的名称的一部分:“Seg#”

当我使用 readr 的“read_csv”读取 csv 时,我看到一条关于解析失败的警告消息,其中显示:预期 25 列,实际 26 列。它读入数据,但每列名称都向右移动,第一列数据(以前在变量“Seg#”下的数据)现在丢失了。

使用 read.csv 会产生相同的数据框,但没有任何警告。

我试图使用上面链接的问题中的建议来解决这个问题:

...但它只是做了同样的事情:删除第一列数据并将所有名称向右移动一次。

当我尝试“read.table”而不是 read.csv 时,我看到以下错误消息:

任何帮助将不胜感激!


编辑:包括数据示例

以下是数据在 Excel 中的外观:

然而,当读入 R 时,数据如下所示:

0 投票
2 回答
1086 浏览

r - 忽略 readr::read_csv 中的尾随分隔符

当我使用 读取包含尾随分隔符的 CSV 文件时readr::read_csv,我收到一条警告,指出已填写了缺少的列名。以下是重现此警告的简短示例 CSV 文件的内容(将以下代码段存储在名为 的文件中example.csv):

请注意每行末尾的尾随逗号。现在如果我加载这个文件

我收到以下警告:

即使我只想显式加载 3 列

我仍然收到警告信息。

这是预期的行为还是有什么方法可以告诉read_csv它应该忽略除我指定的列之外的所有列?还是有另一种方法来整理这个(显然格式错误的)CSV,以便删除/忽略尾随分隔符?

0 投票
1 回答
32 浏览

r - 无法接收所需的输出

我正在处理任务以读取 R Programming 中的固定宽度文件格式,这是我的数据集

http://www.cpc.ncep.noaa.gov/data/indices/wksst8110.for

我使用 readr 包读取文件并使用下面显示的代码清理数据

现在我得到了所需的 9 列,现在我的任务是找到第 4 列的总和,我的答案是 36540,但所需的答案是 32467,任何答案都将不胜感激,提前谢谢。