3

在 R 环境中编程时,我使用了 rep("[35,40)",1020)。这应该给我一个包含 1020 次“[35,40)”的列表。但是,结果仅包含这些元素中的 1019 个。

编程首先是在一个复制的两个向量中完成的,但即使我把它分开也不起作用。

我尝试的是使用不同版本的 R(R 2.11.1、R 2.9.0、R 2.10.0、R 2.7.2),但它们都不能正常工作。

有没有人知道是否有没有这个错误的 R 版本?或者我该如何解决这个问题?

所以这个代码:

> agecats
 [1] "(-0.001,5]" "(5,10]"     "(10,15]"    "(15,20]"    "(20,25]"   
 [6] "(25,30]"    "(30,35]"    "(35,40]"    "(40,45]"    "(45,50]"   
[11] "(50,55]"    "(55,60]"    "(60,65]"    "(65,70]"    "(70,75]"   
[16] "(75,80]"  
> weightage<-c(0.9,0.9,2.7,3.1,8.9,10.05,10.05,10.2,10.2,9.3,9.3,8.7,7.9,3.15,3.15,1.5)
> weightage
 [1]  0.90  0.90  2.70  3.10  8.90 10.05 10.05 10.20 10.20  9.30  9.30  8.70
[13]  7.90  3.15  3.15  1.50

> weightage100<-weightage*100
> weightage100
 [1]   90   90  270  310  890 1005 1005 1020 1020  930  930  870  790  315  315
[16]  150
> tosamplefrom<-rep(agecats,weightage100)
> table(tosamplefrom)
tosamplefrom
(-0.001,5]    (10,15]    (15,20]    (20,25]    (25,30]    (30,35]    (35,40] 
        90        270        310        890       1005       1005       1019 
   (40,45]    (45,50]     (5,10]    (50,55]    (55,60]    (60,65]    (65,70] 
      1019        930         90        930        869        790        315 
   (70,75]    (75,80] 
       315        150 

在这里我应该有 8 和 9 1020 次,它只给出 1019 次。

4

1 回答 1

11
(10.20 * 100) == 1020
FALSE

这是你的问题。10.2 无法准确表示,一切都将走向地狱,因为您正在乘以一个浮点数并假设它是一个整数。看来 R 必须占用数字的下限或仅使用 as.integer 进行转换:

floor(10.2*100)
1019
as.integer(10.2*100)
1019

无论浮点值略高于还是略低于,舍入都将起作用。以下更改确实解决了该问题。

weightage100 <- round (weightage*100)

阅读R Inferno(像这样的浮点问题并不是 R 独有的,例如,我只是在 python 中复制了它)

于 2010-07-28T10:59:11.623 回答