问题标签 [readr]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
349 浏览

r - 错误:`callback` 必须有两个或多个参数 - 阅读器

我正在尝试通过 R 创建 sqlite 数据库。(它看起来不是很方便,但它应该可以工作。)

我正在使用 readr 和 dplyr 包。由于我有庞大的数据集,我试图通过 read_delim_chunked 拆分数据集,并调用我写的回调函数:

但是,当调用 read_delim_chunked 时:

我收到这个奇怪的错误:

错误:callback必须有两个或多个参数

传递给第二个参数的是什么,它需要在那里?

谢谢

0 投票
1 回答
2454 浏览

r - 读取 csv 时区错误

谷歌搜索了几个小时后,我还没有找到解决这个问题的方法。基本上,当我read_csv("some_file.csv")从包中运行函数时,readr我收到以下错误:

错误:未知的 TZ UTC

并且不读取csv。

我可以读取 CSV 的唯一方法是:

悉尼是我的时区。

但如果可能的话,我宁愿修复错误而不是解决它。有人知道如何永久修复 UTC 错误吗?例如启动说明?塔。

0 投票
0 回答
141 浏览

r - 如何在 R 中确定当前系统语言环境的小数点?

我想readr::parse_number()用于被猜测为“数字”类型的字符向量readr::guess_parser()

我可以使用构建一个语言环境来完成这项工作readr::parse_number( readr::locale(decimal_mark = <a mark to be determined at run time>) )

所以问题是系统区域设置在运行时之前是未知的,并且可能在世界任何地方。有没有办法从系统语言环境中确定小数点?

0 投票
3 回答
412 浏览

python - 将分块文件读入数据框

我对 pandas/r 相当陌生,我不太确定如何将这些数据读入pandasr进行分析。

目前,我在想我可以使用 readr'sread_chunkwise或 pandas's chunksize,但这可能不是我需要的。这真的可以通过 for 循环或使用 purr 遍历所有元素轻松解决吗?

数据:

目前,这是我的功能,但我遇到了一个错误:

>

编辑:

在解决了一些问题之后,我认为这可能是最好的解决方案,借鉴@hereismyname 的解决方案:

0 投票
0 回答
17 浏览

r - 变量名称和类型更改后,readr spec() 不更新

我正在对专有数据进行一些数据争论,并且在spec()更改变量名称或类型后遇到不更新的问题。我将使用mtcars我正在经历的一个例子。谁能让我知道为什么会这样以及如何让它更新?

0 投票
1 回答
1926 浏览

r - 在 R 中使用 read.csv、read_csv 或 read_excel 读取数据时如何指定数值的位数

我正在尝试将地理纬度和经度读入 R。这些地理数据通常是超过 6 位的数值。我试图用“read_excel”包中的 read_excel() 和 base R 中的 read.csv 和“readr”包中的 read_csv() 来读取 excel 文件。但是,上述功能都不能正确读取这些数据而不会丢失信息。所有这些函数,无一例外,只能读取截断为 4 位或 5 位的数值。我还尝试使用“options(digits = 8)”在读取数据之前指定默认数字,但它不起作用。在这里,我为“readr”包中的 read_csv() 函数制作了一个可重现的示例:

系统自动将数据截断为 5 位:

我检查了stackoverflow,似乎没有提出类似的问题。谁能给我一个可行的答案,告诉我如何读取这种信息丢失形式的数据?谢谢。:)

0 投票
1 回答
2102 浏览

r - 使用 readr 包导入时,解析器与 .csv 文件中的列名不匹配

我正在尝试将一个 .csv 文件导入到 R 中,其中包含来自 BLS 的就业数据。当我尝试导入数据时,除了第一列之外,每一列都有效,这给了我错误:

以下命名解析器与列名不匹配:日期

我检查了 .csv 文件,这是正确的列名。我不确定我的代码中的什么给了我错误。这与我自己格式化日期的方式有关吗?

原始数据集可以在这里下载:

https://drive.google.com/file/d/0BzuJJ0j4Lyi6R1h0T0VZOUNyaEU/view?usp=sharing

0 投票
0 回答
472 浏览

r - R readr:获取现有数据的列规范,而不是导入一个?

我有一个在 R 会话中创建的数据集,我想 1)导出为 csv 2)单独保存 readr 类型的列规范。这将允许我稍后使用 read_csv() 并从保存在 2) 中的文件中指定 col_types 来读取这些数据。

问题:spec仅针对使用read_*函数读取的数据获取列规范(属性)。似乎无法从 R 中创建的数据集中直接获取列规范?

到目前为止,我的工作流程是:

  1. 出口项目:write_csv()

  2. 从导出的文件中读取规范:spec_csv().

  3. 保存列规范:write_rds()

  4. 然后终于read_csv(step_1, col_types=step_3)

但这很容易出错,因为spec_csv()它可能会出错:它确实只是猜测,所以如果所有值都是 NA,需要属性任意(字符)类。理想情况下,我希望能够直接从原始数据集中提取列规范,而不是写入/重新加载。我怎样才能做到这一点?即,如何将我的数据框类转换为spec对象?

谢谢!

实际(低效)工作量:

0 投票
0 回答
357 浏览

r - 从 R 中的 read_tsv 转换列类型?

我想以编程方式转换从文件读取的 R 数据框中列的类型。下面的示例已损坏。建议?

文件 foo.tsv:

被破坏的代码:

错误:

在这种情况下read_tsv已经返回一个整数,但我想编写一个传入列名的函数。

此代码有效:

我不知道如何修改它以让我在变量中给出列名。

如果我将 foo 初始化为这样的数据框:

然后原始foo[,x]变体起作用,让我相信这是关于read_tsv.

这显示了一堆东西:

我正在使用 R 3.3.2 和 dplyr 0.5.0。

0 投票
1 回答
2668 浏览

r - 如何使用逗号作为小数点的“cols()”和“col_double”

我想readr在阅读时将我的列与包解析为正确的类型。

难点:字段用分号( )隔开,小数点用;逗号( )。,

所以,我认为解析的事情会像这样工作,但我总是收到错误消息:

同样在这里:

我认为我做的事情根本上是错误的。;)

另外,我将不胜感激有关如何read_delim将逗号理解为小数点的提示。read.delim可以很容易地做到这一点,dec = ","但我真的很想从一开始就使用“readr”-Package,而不必费力。以前的版本有一个col_euro_double功能,但已被删除。现在有什么替代方案?