问题标签 [readr]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - 错误:`callback` 必须有两个或多个参数 - 阅读器
我正在尝试通过 R 创建 sqlite 数据库。(它看起来不是很方便,但它应该可以工作。)
我正在使用 readr 和 dplyr 包。由于我有庞大的数据集,我试图通过 read_delim_chunked 拆分数据集,并调用我写的回调函数:
但是,当调用 read_delim_chunked 时:
我收到这个奇怪的错误:
错误:
callback
必须有两个或多个参数
传递给第二个参数的是什么,它需要在那里?
谢谢
r - 读取 csv 时区错误
谷歌搜索了几个小时后,我还没有找到解决这个问题的方法。基本上,当我read_csv("some_file.csv")
从包中运行函数时,readr
我收到以下错误:
错误:未知的 TZ UTC
并且不读取csv。
我可以读取 CSV 的唯一方法是:
悉尼是我的时区。
但如果可能的话,我宁愿修复错误而不是解决它。有人知道如何永久修复 UTC 错误吗?例如启动说明?塔。
r - 如何在 R 中确定当前系统语言环境的小数点?
我想readr::parse_number()
用于被猜测为“数字”类型的字符向量readr::guess_parser()
我可以使用构建一个语言环境来完成这项工作readr::parse_number( readr::locale(decimal_mark = <a mark to be determined at run time>) )
所以问题是系统区域设置在运行时之前是未知的,并且可能在世界任何地方。有没有办法从系统语言环境中确定小数点?
python - 将分块文件读入数据框
我对 pandas/r 相当陌生,我不太确定如何将这些数据读入pandas
或r
进行分析。
目前,我在想我可以使用 readr'sread_chunkwise
或 pandas's chunksize
,但这可能不是我需要的。这真的可以通过 for 循环或使用 purr 遍历所有元素轻松解决吗?
数据:
目前,这是我的功能,但我遇到了一个错误:
>
编辑:
在解决了一些问题之后,我认为这可能是最好的解决方案,借鉴@hereismyname 的解决方案:
r - 变量名称和类型更改后,readr spec() 不更新
我正在对专有数据进行一些数据争论,并且在spec()
更改变量名称或类型后遇到不更新的问题。我将使用mtcars
我正在经历的一个例子。谁能让我知道为什么会这样以及如何让它更新?
r - 在 R 中使用 read.csv、read_csv 或 read_excel 读取数据时如何指定数值的位数
我正在尝试将地理纬度和经度读入 R。这些地理数据通常是超过 6 位的数值。我试图用“read_excel”包中的 read_excel() 和 base R 中的 read.csv 和“readr”包中的 read_csv() 来读取 excel 文件。但是,上述功能都不能正确读取这些数据而不会丢失信息。所有这些函数,无一例外,只能读取截断为 4 位或 5 位的数值。我还尝试使用“options(digits = 8)”在读取数据之前指定默认数字,但它不起作用。在这里,我为“readr”包中的 read_csv() 函数制作了一个可重现的示例:
系统自动将数据截断为 5 位:
我检查了stackoverflow,似乎没有提出类似的问题。谁能给我一个可行的答案,告诉我如何读取这种信息丢失形式的数据?谢谢。:)
r - 使用 readr 包导入时,解析器与 .csv 文件中的列名不匹配
我正在尝试将一个 .csv 文件导入到 R 中,其中包含来自 BLS 的就业数据。当我尝试导入数据时,除了第一列之外,每一列都有效,这给了我错误:
以下命名解析器与列名不匹配:日期
我检查了 .csv 文件,这是正确的列名。我不确定我的代码中的什么给了我错误。这与我自己格式化日期的方式有关吗?
原始数据集可以在这里下载:
https://drive.google.com/file/d/0BzuJJ0j4Lyi6R1h0T0VZOUNyaEU/view?usp=sharing
r - R readr:获取现有数据的列规范,而不是导入一个?
我有一个在 R 会话中创建的数据集,我想 1)导出为 csv 2)单独保存 readr 类型的列规范。这将允许我稍后使用 read_csv() 并从保存在 2) 中的文件中指定 col_types 来读取这些数据。
问题:spec
仅针对使用read_*
函数读取的数据获取列规范(属性)。似乎无法从 R 中创建的数据集中直接获取列规范?
到目前为止,我的工作流程是:
出口项目:
write_csv()
从导出的文件中读取规范:
spec_csv()
.保存列规范:
write_rds()
然后终于
read_csv(step_1, col_types=step_3)
但这很容易出错,因为spec_csv()
它可能会出错:它确实只是猜测,所以如果所有值都是 NA,需要属性任意(字符)类。理想情况下,我希望能够直接从原始数据集中提取列规范,而不是写入/重新加载。我怎样才能做到这一点?即,如何将我的数据框类转换为spec
对象?
谢谢!
实际(低效)工作量:
r - 从 R 中的 read_tsv 转换列类型?
我想以编程方式转换从文件读取的 R 数据框中列的类型。下面的示例已损坏。建议?
文件 foo.tsv:
被破坏的代码:
错误:
在这种情况下read_tsv
已经返回一个整数,但我想编写一个传入列名的函数。
此代码有效:
我不知道如何修改它以让我在变量中给出列名。
如果我将 foo 初始化为这样的数据框:
然后原始foo[,x]
变体起作用,让我相信这是关于read_tsv
.
这显示了一堆东西:
我正在使用 R 3.3.2 和 dplyr 0.5.0。
r - 如何使用逗号作为小数点的“cols()”和“col_double”
我想readr
在阅读时将我的列与包解析为正确的类型。
难点:字段用分号( )隔开,小数点用;
逗号( )。,
所以,我认为解析的事情会像这样工作,但我总是收到错误消息:
同样在这里:
我认为我做的事情根本上是错误的。;)
另外,我将不胜感激有关如何read_delim
将逗号理解为小数点的提示。read.delim
可以很容易地做到这一点,dec = ","
但我真的很想从一开始就使用“readr”-Package,而不必费力。以前的版本有一个col_euro_double
功能,但已被删除。现在有什么替代方案?