2

我有一个包含一Reference列的数据框。这是一个 10 位数字,可以从零开始。导入 R 时,前导零消失,我想重新添加。

我尝试过使用sprintfand formatC,但每个都有不同的问题。

DF=data.frame(Reference=c(102030405,2567894562,235648759), Data=c(10,20,30))

我得到的输出如下:

> sprintf('%010d', DF$Reference)
[1] "0102030405" "        NA" "0235648759"
Warning message:
In sprintf("%010d", DF$Reference) : NAs introduced by coercion
> formatC(DF$Reference, width=10, flag="0")
[1] "001.02e+08" "02.568e+09" "02.356e+08"

当数字已经有 10 位时,第一个输出给出 NA,第二个输出以标准格式存储结果。

我需要的是:

[1]  0102030405 2567894562  0235648759
4

2 回答 2

6
library(stringi)
DF = data.frame(Reference = c(102030405,2567894562,235648759), Data = c(10,20,30))
DF$Reference = stri_pad_left(DF$Reference, 10, "0")
DF
#    Reference Data
# 1 0102030405   10
# 2 2567894562   20
# 3 0235648759   30

替代解决方案:使用 R 添加前导零

导入 R 时,前导零消失,我想重新添加。

将列读取为字符将完全避免此问题。您可以readr::read_csv()col_types参数一起使用。

于 2016-03-07T13:00:24.817 回答
1

格式C

您可以使用

formatC(DF$Reference, digits = 0,  width = 10, format ="f", flag="0")
# [1] "0102030405" "2567894562" "0235648759"

冲刺

din的使用sprintf意味着您的值是整数(或者它们必须用 转换as.integer())。 help(integer)解释说:

“可表示整数的范围被限制在大约 +/-2*10^9:双精度数可以精确地容纳更大的整数。”

这就是为什么as.integer(2567894562)返回NA

另一种解决方法是在中使用字符s格式sprintf

sprintf('%010s',DF$Reference)
# [1] " 102030405" "2567894562" " 235648759"

但这给出了空格而不是前导零。gsub()可以通过用零替换空格来添加零:

gsub(" ","0",sprintf('%010s',DF$Reference))
# [1] "0102030405" "2567894562" "0235648759"
于 2016-03-07T13:46:52.873 回答