0

所以我有一个 mongodb 数据库,想随机分区。

我的意思是数据库的大小为 $s$ 并且我希望将其拆分以便我有 $frac{s}{2}$ 来训练我的分类器和 $frac{s}{2}$ 来测试它的准确性。~~ 交叉折叠验证。我怎样才能做到这一点?我正在考虑为每个条目分配一个整数,然后只选择一个随机抽样就给出一个从 0 到 1000 的范围。问题是我不知道它何时更新以及何时插入。因此,如果它是一个新条目,我只会增加要插入的值。所以我想用 getLastError 来检查一下?

我觉得有更好的方法来做到这一点......

有什么建议么?

谢谢,

4

0 回答 0