我想计算一个节点到根的距离dtr
。我所拥有的只是一个向量,其中包含每个节点的父节点 ID rel
(在此示例id == 7
中为根节点):
library(tidyverse)
tmp <- tibble(
id = 1:12,
rel = c(2,7,4,2,4,5,7,7,10,8,7,7)
)
最后我正在寻找这个结果:
tmp$dtr
[1] 2 1 3 2 3 4 0 1 3 2 1 1
到目前为止,我能够编写以下算法,直到我在尝试引用代码中的不同行时卡住了。
该算法应该像这样工作(伪代码):
- 如果不是根,则递增
dtr
:if(!equals(tid,trel)): dtr = dtr+1
- 更改
tid
为trel
:tid = trel
- 更改
trel
为rel
其中的值id == trel
- 如果有任何
!equals(tid,trel)
GOTO 1.,否则 END
首先,我添加了 2 个辅助列来存储临时信息:
tmp <- tmp %>%
mutate(
tid = id,
trel = rel,
dtr = 0
)
算法的前两个步骤是这样工作的:
tmp <- tmp %>%
mutate(
dtr = if_else(
!equals(tid,trel),
dtr + 1,
dtr
),
tid = trel
)
第三步我不确定....我尝试使用以下代码来实现它,但这不起作用:
tmp <- tmp %>%
mutate(trel = rel[id == .$tid])
结果(当然)是错误的:
tmp$rel
[1] 7 7 7 7 7 7 7 7 7 7 7 7
但为什么不呢?(3.第一次运行时应该是正确的解决方案):
[1] 2 7 2 7 2 4 7 7 10 8 7 7
第 4 步是通过检查我在 trel 中是否有多个唯一值来完成的:
while(length(unique(tmp$trel)) > 1){
...
}
因此,完整的算法应该看起来像这样:
get_dtr <- function(tib){
tmp <- tib %>%
mutate(
tid = id,
trel = rel,
dtr = 0
)
while(length(unique(tmp$trel)) > 1){
tmp <- tmp %>%
mutate(
dtr = if_else(
!equals(tid,trel),
dtr + 1,
dtr
),
tid = trel
)
### Step 3
}
tmp
}
知道如何解决这个问题或更简单的解决方案吗?提前致谢!