问题标签 [readr]

问问题

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

446 问题

0 投票

3 回答

226 浏览

r - 无法使用 readr 阻止因子列中空单元格的 NA

我正在尝试读取带有一些空单元格的文件并获得预期的空单元格NA。我有一些特殊的列，它们只能有值''或'+'. 所以我想通过使用将这些列设置为因子类

但是该列仍然NAs在这些列中。readr_tsv我可以通过更改参数来更改函数的全局行为na，但这不是我想要的。我只想在特定列中更改它。

有没有办法将这些NAs直接转换为''？之后我肯定可以这样做，但我想知道我是否以错误的方式使用了这个东西。

编辑这是一个测试文件

我如何实际上传文件？我只能附上图片...

r readr

2016-11-11T14:34:19.493

0 投票

1 回答

2967 浏览

r - dplyr：如何在跳过某些行的同时读取带有标题的 tsv 文件？

我有一个tsv具有以下结构的简单文件：

我想阅读它，可能正在使用，readr::read_tsv但这是问题所在。

如您所见，第一行包含标题。然后我有三行我不想读取它（它们包含一些来自 Apache PIG 的超级奇怪的数据），并且在第 4 行数据开始。在Pandas，我会做类似的事情

这使我可以阅读标题并跳过第一、二、三行。

我没有看到类似的选项readr::read_tsv。那是：

df = read_tsv('/localpath/data.tsv', col_names = TRUE, skip = 4)

它不解析标题...

有任何想法吗？

r csv data.table dplyr readr

2016-11-17T13:58:35.783

0 投票

1 回答

84 浏览

r - 解析字符串向量中的德语数字

有一个字符串如下：

我想将其解析为

我试过：

我想出的唯一方法：

r parsing readr tidyverse

2016-11-26T16:38:08.007

0 投票

2 回答

5559 浏览

r - 如何使 R 的 read_csv2() 正确识别文本字符

尝试使用read_csv2()from readrpackage 读取 csv 文件。

问题是R 的默认值成功read_csv2()识别时无法正确识别字符。read.csv2

例如：

原始值：KOZYATAĞI

如何read_csv2()识别：KOZYATA<'d0'>I

我检查了帮助文件并尝试了下面列出的编码；但是无法实现。

第一次尝试：以错误的字符结束

第二次尝试：手动说明编码。

第三次尝试：由于上面的错误消息，对第二次尝试进行了补充。

这个没有给出错误，但仍然不能正确识别字符。

怎么做？让我知道是否需要任何其他信息。提前致谢。

r utf-8 character readr

2016-12-03T09:15:39.443

0 投票

1 回答

1379 浏览

r - Readr:read_csv 有特定日期时间的问题

我最近发现了提供 CSV 导出的芝加哥犯罪数据网站。使用 readr 导入 6.2M+ 记录后，我注意到无法读取时间在 12:00:00 PM 和 12:59:59 PM 之间的所有 Date 记录。

我使用以下导入：

问题（）显示以下内容：

所有其他时间导入没有问题。

输入文件具有以下格式的日期字段：“04/06/2005 12:30:00 PM”。任何帮助或意见？（Windows 10 上的 R 3.3.2，最新包）

r datetime readr

2016-12-04T22:43:19.417

0 投票

1 回答

499 浏览

r - 如何使用 readr 读取没有年份的日期？

我有一个数据文件，其中给出的日期没有年份。

我试着这样读

但它接缝的是，readr 的日期解析器无法解析没有年份的日期。另一方面，lubridate 可以处理这样的日期：

有什么方法可以让读者阅读这些日期或使用 lubridate？

如果 readr 无法处理这样的“日期”或一年中的某一天，我将按以下方式使用 dplyr：

r readr

2016-12-15T21:36:03.390

0 投票

4 回答

5590 浏览

r - 如何编写 dplyr 组来分隔文件？

我正在尝试为使用 dplyr 的 group_by 函数分组的数据框中的每个组创建单独的 .csv 文件。到目前为止，我有类似的东西

正如预期的那样，这将写入一个仅包含最后一组数据的 .csv 文件。如何修改它以编写多个 .csv 文件，每个文件的文件名都包含 cyl？

r csv dplyr readr

2016-12-20T00:32:33.967

0 投票

1 回答

375 浏览

r - 使用标题中带有数字符号的变量读取 csv 问题 [r]

我有一个与过去的问题类似的问题：如何将“数字符号-#”作为列标题的一部分阅读？

我也有一个英镑/哈希/数字符号作为 csv 文件中第一个变量的名称的一部分：“Seg#”

当我使用 readr 的“read_csv”读取 csv 时，我看到一条关于解析失败的警告消息，其中显示：预期 25 列，实际 26 列。它读入数据，但每列名称都向右移动，第一列数据（以前在变量“Seg#”下的数据）现在丢失了。

使用 read.csv 会产生相同的数据框，但没有任何警告。

我试图使用上面链接的问题中的建议来解决这个问题：

...但它只是做了同样的事情：删除第一列数据并将所有名称向右移动一次。

当我尝试“read.table”而不是 read.csv 时，我看到以下错误消息：

任何帮助将不胜感激！

编辑：包括数据示例

以下是数据在 Excel 中的外观：

然而，当读入 R 时，数据如下所示：

r csv read.csv readr

2016-12-21T18:47:52.130

0 投票

2 回答

1086 浏览

r - 忽略 readr::read_csv 中的尾随分隔符

当我使用读取包含尾随分隔符的 CSV 文件时readr::read_csv，我收到一条警告，指出已填写了缺少的列名。以下是重现此警告的简短示例 CSV 文件的内容（将以下代码段存储在名为的文件中example.csv）：

请注意每行末尾的尾随逗号。现在如果我加载这个文件

我收到以下警告：

即使我只想显式加载 3 列

我仍然收到警告信息。

这是预期的行为还是有什么方法可以告诉read_csv它应该忽略除我指定的列之外的所有列？还是有另一种方法来整理这个（显然格式错误的）CSV，以便删除/忽略尾随分隔符？

r csv readr tidyverse

2016-12-22T09:54:36.963

0 投票

1 回答

32 浏览

r - 无法接收所需的输出

我正在处理任务以读取 R Programming 中的固定宽度文件格式，这是我的数据集

http://www.cpc.ncep.noaa.gov/data/indices/wksst8110.for

我使用 readr 包读取文件并使用下面显示的代码清理数据

现在我得到了所需的 9 列，现在我的任务是找到第 4 列的总和，我的答案是 36540，但所需的答案是 32467，任何答案都将不胜感激，提前谢谢。

r readr

2016-12-30T17:55:28.890

1 2 3 4 5 6 7 8 9 10

问题标签 [readr]

Reference