我正在编写一个校准管道来学习神经网络的超参数以检测 DNA 序列的属性*。因此,这需要在具有不同超参数的同一数据集上训练大量模型。
我正在尝试优化它以在 GPU 上运行。与图像数据集相比,DNA 序列数据集非常小(通常 4 个“通道”中有 10 或 100 个碱基对来表示 4 个 DNA 碱基 A、C、G 和 T,而 3 个 RGB 通道中有 10,000 个像素) ,因此无法充分利用 GPU 上的并行化,除非同时训练多个模型。
有没有办法在 nolearn、千层面或最糟糕的 Theano 中做到这一点?
*如果您有兴趣,它基于DeepBind 模型,用于检测转录因子与 DNA 结合的位置。