这个问题可能之前已经回答过了,但我没有看到答案。
我有一个由数字和缺失值组成的数据集。一行是一个百分比。下面是一小部分假数据,其中 AA、BB 和 CC 是列名。该数据集中的第三行是百分比。
AA BB CC
234 432 78
1980 3452 2323
91.1 90 93.3
34 123 45
在这种情况下,当我读取数据集时,AA 和 CC 是数字,BB 是整数。我猜某处 90.0 被舍入到 90。如果我没有指定 BB 是数字,这会导致基本算术问题吗?
我相信如果 dd = 1 和 ee = 2 并且都是整数,那么 C 语言说 dd / ee = 0,而 R 说 dd / ee = 0.5。
下面是一系列简单的数学运算,似乎都表明 R 中的答案不会改变,无论数据是数字还是整数。尽管如此,我一直认为在读取数据时指定所有变量都是数字是明智的。使用谷歌,我发现了一个或两个数据类型似乎确实有所不同的例子,但不是在下面。
aa <- c(1,2,3,4,5,6,7)
bb <- 2
str(aa)
str(bb)
cc <- as.integer(aa)
dd <- as.integer(bb)
str(cc)
str(dd)
aa/bb
cc/dd
aa/dd
cc/bb
ee <- aa * aa
str(ee)
sum(ee/2)
ff <- cc * cc
str(ff)
sum(ff/2)
gg <- 4.14
hh <- ((aa * aa) * gg) / 2
hh
ii <- ((cc * cc) * gg) / 2
ii
jj <- (aa * aa) / gg
jj
kk <- (cc * cc) / gg
kk
jj == kk
mm <- as.integer(1)
nn <- as.integer(2)
mm/nn
我想我希望得到保证,这不太可能是简单数学的问题,但我怀疑它可以。我一直认为这里有一个编程的基本规则,但我不确定那是什么。(我知道双精度的概念。)
感谢您对肯定是基本问题的任何建议。