“readr”的相关标签问题_Stack Overflow中文网

0 投票

1 回答

349 浏览

r - 错误：`callback` 必须有两个或多个参数 - 阅读器

我正在尝试通过 R 创建 sqlite 数据库。（它看起来不是很方便，但它应该可以工作。）

我正在使用 readr 和 dplyr 包。由于我有庞大的数据集，我试图通过 read_delim_chunked 拆分数据集，并调用我写的回调函数：

但是，当调用 read_delim_chunked 时：

我收到这个奇怪的错误：

错误：callback必须有两个或多个参数

传递给第二个参数的是什么，它需要在那里？

谢谢

r readr

2017-03-05T12:44:43.707

0 投票

1 回答

2454 浏览

r - 读取 csv 时区错误

谷歌搜索了几个小时后，我还没有找到解决这个问题的方法。基本上，当我read_csv("some_file.csv")从包中运行函数时，readr我收到以下错误：

错误：未知的 TZ UTC

并且不读取csv。

我可以读取 CSV 的唯一方法是：

悉尼是我的时区。

但如果可能的话，我宁愿修复错误而不是解决它。有人知道如何永久修复 UTC 错误吗？例如启动说明？塔。

r timezone readr

2017-03-07T00:35:28.630

0 投票

0 回答

141 浏览

r - 如何在 R 中确定当前系统语言环境的小数点？

我想readr::parse_number()用于被猜测为“数字”类型的字符向量readr::guess_parser()

我可以使用构建一个语言环境来完成这项工作readr::parse_number( readr::locale(decimal_mark = <a mark to be determined at run time>) )

所以问题是系统区域设置在运行时之前是未知的，并且可能在世界任何地方。有没有办法从系统语言环境中确定小数点？

r readr

2017-03-07T02:45:31.407

0 投票

3 回答

412 浏览

python - 将分块文件读入数据框

我对 pandas/r 相当陌生，我不太确定如何将这些数据读入pandas或r进行分析。

目前，我在想我可以使用 readr'sread_chunkwise或 pandas's chunksize，但这可能不是我需要的。这真的可以通过 for 循环或使用 purr 遍历所有元素轻松解决吗？

数据：

目前，这是我的功能，但我遇到了一个错误：

>

编辑：

在解决了一些问题之后，我认为这可能是最好的解决方案，借鉴@hereismyname 的解决方案：

python r pandas tidyr readr

2017-03-07T04:26:47.267

0 投票

0 回答

17 浏览

r - 变量名称和类型更改后，readr spec() 不更新

我正在对专有数据进行一些数据争论，并且在spec()更改变量名称或类型后遇到不更新的问题。我将使用mtcars我正在经历的一个例子。谁能让我知道为什么会这样以及如何让它更新？

r readr

2017-03-16T20:53:38.653

0 投票

1 回答

1926 浏览

r - 在 R 中使用 read.csv、read_csv 或 read_excel 读取数据时如何指定数值的位数

我正在尝试将地理纬度和经度读入 R。这些地理数据通常是超过 6 位的数值。我试图用“read_excel”包中的 read_excel() 和 base R 中的 read.csv 和“readr”包中的 read_csv() 来读取 excel 文件。但是，上述功能都不能正确读取这些数据而不会丢失信息。所有这些函数，无一例外，只能读取截断为 4 位或 5 位的数值。我还尝试使用“options(digits = 8)”在读取数据之前指定默认数字，但它不起作用。在这里，我为“readr”包中的 read_csv() 函数制作了一个可重现的示例：

系统自动将数据截断为 5 位：

我检查了stackoverflow，似乎没有提出类似的问题。谁能给我一个可行的答案，告诉我如何读取这种信息丢失形式的数据？谢谢。:)

r csv data-import readr

2017-03-20T13:24:46.680

0 投票

1 回答

2102 浏览

r - 使用 readr 包导入时，解析器与 .csv 文件中的列名不匹配

我正在尝试将一个 .csv 文件导入到 R 中，其中包含来自 BLS 的就业数据。当我尝试导入数据时，除了第一列之外，每一列都有效，这给了我错误：

以下命名解析器与列名不匹配：日期

我检查了 .csv 文件，这是正确的列名。我不确定我的代码中的什么给了我错误。这与我自己格式化日期的方式有关吗？

原始数据集可以在这里下载：

https://drive.google.com/file/d/0BzuJJ0j4Lyi6R1h0T0VZOUNyaEU/view?usp=sharing

r csv import readr

2017-03-21T17:13:04.627

0 投票

0 回答

472 浏览

r - R readr：获取现有数据的列规范，而不是导入一个？

我有一个在 R 会话中创建的数据集，我想 1）导出为 csv 2）单独保存 readr 类型的列规范。这将允许我稍后使用 read_csv() 并从保存在 2) 中的文件中指定 col_types 来读取这些数据。

问题：spec仅针对使用read_*函数读取的数据获取列规范（属性）。似乎无法从 R 中创建的数据集中直接获取列规范？

到目前为止，我的工作流程是：

出口项目：write_csv()
从导出的文件中读取规范：spec_csv().
保存列规范：write_rds()
然后终于read_csv(step_1, col_types=step_3)

但这很容易出错，因为spec_csv()它可能会出错：它确实只是猜测，所以如果所有值都是 NA，需要属性任意（字符）类。理想情况下，我希望能够直接从原始数据集中提取列规范，而不是写入/重新加载。我怎样才能做到这一点？即，如何将我的数据框类转换为spec对象？

谢谢！

实际（低效）工作量：

r tidyverse readr

2017-03-23T19:48:39.943

0 投票

0 回答

357 浏览

r - 从 R 中的 read_tsv 转换列类型？

我想以编程方式转换从文件读取的 R 数据框中列的类型。下面的示例已损坏。建议？

文件 foo.tsv：

被破坏的代码：

错误：

在这种情况下read_tsv已经返回一个整数，但我想编写一个传入列名的函数。

此代码有效：

我不知道如何修改它以让我在变量中给出列名。

如果我将 foo 初始化为这样的数据框：

然后原始foo[,x]变体起作用，让我相信这是关于read_tsv.

这显示了一堆东西：

我正在使用 R 3.3.2 和 dplyr 0.5.0。

r dplyr readr

2017-03-27T17:00:16.417

0 投票

1 回答

2668 浏览

r - 如何使用逗号作为小数点的“cols()”和“col_double”

我想readr在阅读时将我的列与包解析为正确的类型。

难点：字段用分号（）隔开，小数点用;逗号（）。,

所以，我认为解析的事情会像这样工作，但我总是收到错误消息：

同样在这里：

我认为我做的事情根本上是错误的。;)

另外，我将不胜感激有关如何read_delim将逗号理解为小数点的提示。read.delim可以很容易地做到这一点，dec = ","但我真的很想从一开始就使用“readr”-Package，而不必费力。以前的版本有一个col_euro_double功能，但已被删除。现在有什么替代方案？

r csv readr

2017-04-05T15:03:24.003

问题标签 [readr]

Reference