16

如果我想从 Jupyter Notebook 下载所有文件和文件夹层次结构,如图所示,您知道是否有任何方法可以通过简单的单击来完成,而不是转到每个文件夹中的每个文件以打开文件并单击下载数百次?

在此处输入图像描述

注意:这个 Jupyter Notebook 是由在线课程老师创建的,所以它不是从我本地的 Acaconda 应用程序打开的,而是从在线课程网页打开的。下载是为了将来在需要时刷新内存。

4

2 回答 2

31
import os
import tarfile

def recursive_files(dir_name='.', ignore=None):
    for dir_name,subdirs,files in os.walk(dir_name):
        if ignore and os.path.basename(dir_name) in ignore: 
            continue

        for file_name in files:
            if ignore and file_name in ignore:
                continue

            yield os.path.join(dir_name, file_name)

def make_tar_file(dir_name='.', tar_file_name='tarfile.tar', ignore=None):
    tar = tarfile.open(tar_file_name, 'w')

    for file_name in recursive_files(dir_name, ignore):
        tar.add(file_name)

    tar.close()


dir_name = '.'
tar_file_name = 'archive.tar'
ignore = {'.ipynb_checkpoints', '__pycache__', tar_file_name}
make_tar_file(dir_name, tar_file_name, ignore)

要使用它,只需在您要下载的根文件夹中创建一个新的 .ipynb 笔记本。然后将上面的代码复制并粘贴到第一个单元格中并运行它。

完成后 - 您将看到在同一文件夹中创建的 tar 文件,其中包含所有文件和子文件夹。

于 2018-01-07T21:26:47.407 回答
7

上面发布的答案大多有效,但它的复制链接而不是链接指向的文件。如果您将 dereference=True 作为参数添加到 tarfile.open,您将获得文件本身。

    tar = tarfile.open(tar_file_name, 'w', dereference=True)
于 2018-08-25T15:49:56.653 回答