0

我发现 batch_norm 可能会导致小批量的问题,而 GroupNorm 是一个不错的选择。现在,GroupNorm 需要两个参数,num_group 和 num_channels。如何为 num_group 选择一个好的值?这取决于什么?使用 groupnorm,大 batch_size 好还是小 batch_size 好?

4

0 回答 0