当我在 google colab 中编写此代码时:
import pickle
x=10;
output = open('data.pkl', 'wb')
pickle.dump(x,output)
x 已保存,并且还在 Google Colab 的另一个窗口中我可以访问该文件并阅读它,但我不知道该文件在哪里。有人知道它在哪里吗?
当我在 google colab 中编写此代码时:
import pickle
x=10;
output = open('data.pkl', 'wb')
pickle.dump(x,output)
x 已保存,并且还在 Google Colab 的另一个窗口中我可以访问该文件并阅读它,但我不知道该文件在哪里。有人知道它在哪里吗?
它在当前目录中。您也可以使用以下命令将其下载回本地计算机
from google.colab import files
files.download(‘data.pkl’)
您可以将其上传到您的 Google 驱动器:
from pydrive.auth import GoogleAuth
from pydrive.drive import GoogleDrive
from google.colab import auth
from oauth2client.client import GoogleCredentials
# 1. Authenticate and create the PyDrive client.
auth.authenticate_user()
gauth = GoogleAuth()
gauth.credentials = GoogleCredentials.get_application_default()
drive = GoogleDrive(gauth)
# get the folder id where you want to save your file
file = drive.CreateFile({'parents':[{u'id': folder_id}]})
file.SetContentFile('data.pkl')
file.Upload()
此代码基本上从云 VM 中获取 data.pkl 并将其永久上传到特定文件夹下的 Google Drive。
如果您选择不指定文件夹,该文件将上传到您的 Google Drive 的根目录下。
您可以在 Google 驱动器文件夹中的任何位置保存和读取转储文件。
import gc
import pickle
from google.colab import drive
drive.mount('/content/drive', force_remount=True)
pick_insert = open('drive/My Drive/data.pickle','wb')
pickle.dump(data, pick_insert)
pick_insert.close()
pick_read = open('drive/My Drive/data.pickle','rb')
data = pickle.load(pick_read)
pick_read.close()
然后可以从以下相同的目录加载保存的转储,
dump(stories, open('review_dataset.pkl', 'wb'))
stories = load(open('review_dataset.pkl', 'rb'))
就我而言,我试图访问目录下的子目录(数据)中的泡菜文件.
。
数据目录有 2 个从预处理步骤生成的泡菜文件。
所以我在评论中尝试了@korakot 的建议,效果很好!这就是我到目前为止所做的。
# connect your colab with the drive
from google.colab import drive
drive.mount('/content/drive')
# list the directories in the home directory
import os
os.listdir('.')
# move the sub-directory (data) into google-drive
mv /content/data/ /content/drive/MyDrive/
您可以使用以下语句获取 pkl 文件
from google.colab import files files
files.download("model.pkl")
不仅pkl,您还可以通过更改扩展名来检索其他格式的数据