我的问题与这个问题有关。我对计算精确召回曲线(PRC)和PRC下的面积感兴趣。我找到了一个不错的 R 包PRROC来完成这两项任务。根据函数pr.curve的包描述(第 5 页),您必须提供 2 个参数。1)仅属于正类的数据点的分类分数 2)仅属于负类的数据点的分类分数(参见手册第 7 页)。他们提供的例子是:
# create artificial scores as random numbers
x <- rnorm( 1000 );
y <- rnorm( 1000, -1 );
# compute PR curve
pr <- pr.curve( x, y, curve = TRUE );
我的问题是我在正类中有 14000 个数据点,在负类中有 2560595 个数据点,对于这样的数据,它已经是 1 天了,但我仍然没有得到结果。为简单起见,您可以尝试扩展已经给出的示例。
# create artificial scores as random numbers
x <- rnorm( 14000 );
y <- rnorm( 2560595, -1 );
# compute PR curve
pr <- pr.curve( x, y, curve = TRUE );