2

考虑根据经验估计 和中的条件分布离散XY

Pr(Y|X)

两个变量都已映射到整数集,使得

X in {1, ..., N_X} and Y in {1, ..., N_Y}

我有一个观察数据框obs,例如obs$x[t]obs$y[t]是我的观察值XY事件值t

那么我的问题是,转换为包含经验分布obs的矩阵的最有效方法是什么F

F[i,j] = sum((obs$x == i) & (obs$y == j))/sum(obs$x == i)

当然,我可以使用双 for 循环i in (1:N_X)j in (1:N_Y)但我正在寻找最有效的方法。

4

1 回答 1

1

这是一种data.table可能可以进一步优化的方法

#data
library(data.table)
Nx <- 1e3
Ny <- 1e2
num <- 1e4
set.seed(1L)
obs <- data.table(t=1:num, 
    x=sample(1:Nx, num, replace=TRUE),
    y=sample(1:Ny, num, replace=TRUE))

#calculate F_{i,j}
ans <- obs[, {
        n = .N
        .SD[, list(Fxy=.N/n), by=.(y)]
    }, by=.(x)]

#convert into matrix
library(Matrix)
matAns <- as.matrix(sparseMatrix(
    i=ans[["x"]], 
    j=ans[["y"]],
    x=ans[["Fxy"]]
))

head(matAns)

很想学习一种更快的方法来计算这个

于 2017-04-05T09:44:15.033 回答