1

我的 Google colab 在开始tiny-imagenet使用 10 万张图像和 200 个大小为 64*64 的类别进行训练后立即崩溃

Colab 日志显示

WARNING:root:kernel 1fe0be22-c98a-4519-a16a-69c9fb4be1da restarted
KernelRestarter: restarting kernel (1/5), keep random ports 
tensorflow/stream_executor/dso_loader.cc:152] successfully opened CUDA library libcublas.so.10.0 locally
tensorflow/core/common_runtime/gpu/gpu_device.cc:1115] Created TensorFlow device (/job:localhost/replica:0/task:0/device:GPU:0 with 10754 MB memory) -> physical GPU (device: 0, name: Tesla K80, pci bus id: 0000:00:04.0, compute capability: 3.7)

我正在使用model.fit_generator批量大小(从 32 到 1024 尝试)和图像大小(从 16 到 64 尝试)但没有任何效果。

我尝试resnet-18了具有 (1.8*10^9 参数) 的架构以及具有 80 万参数的自定义模型,但徒劳无功。

我将链接粘贴到我的 colab 以防有人需要其他信息 https://colab.research.google.com/drive/1QG1mg1zOn6gZaaSv4rrI4F6erdxsxQ8V#scrollTo=Uy0M-VDHivOX

4

0 回答 0