我的问题:
a) 我得到了一个数据集,用于在 6 个时间点表达 1000 个基因。
b) 一些基因 ( testing set
) 属于某个类别,其特征是基因表达在这些时间点上的分布。
c) 我也有这个类的已知基因数据集 ( training set
)。
d)此外,我想false
通过随机重组我的测试集来生成一个数据集,并将该数据集包含在我的 SVM 模型中。
我想我知道如何(a)-(c)
通过使用R
和e1071
包来做,但我不确定如何实现(d)
. 我应该只用计算模型测试我的false
数据,然后比较这个数据集上的结果test set
吗?
我应该使用哪些分布进行比较?(paretro
或者也许universal gamma
提供我计算出的概率?)