我的问题:
a) 我得到了一个数据集,用于在 6 个时间点表达 1000 个基因。
b) 一些基因 ( testing set) 属于某个类别,其特征是基因表达在这些时间点上的分布。
c) 我也有这个类的已知基因数据集 ( training set)。
d)此外,我想false通过随机重组我的测试集来生成一个数据集,并将该数据集包含在我的 SVM 模型中。
我想我知道如何(a)-(c)通过使用R和e1071包来做,但我不确定如何实现(d). 我应该只用计算模型测试我的false数据,然后比较这个数据集上的结果test set吗?
我应该使用哪些分布进行比较?(paretro或者也许universal gamma提供我计算出的概率?)