我正在按照本教程中的示例进行操作。
而不是按如下方式加载数据集:
dataset = datasets.fetch_mldata("MNIST Original")
如何从“本地”文件夹加载数据集?为了在示例中使用数据,是否有特定的数据结构?
谢谢。
我正在按照本教程中的示例进行操作。
而不是按如下方式加载数据集:
dataset = datasets.fetch_mldata("MNIST Original")
如何从“本地”文件夹加载数据集?为了在示例中使用数据,是否有特定的数据结构?
谢谢。
我认为答案已经在您提供的页面中找到
我们在第 13 行调用 fetch_mldata 函数,从 mldata.org 存储库下载原始 MNIST 数据集。
实际数据集大约为 55mb,因此下载可能需要几秒钟。但是,一旦下载了数据集,它就会在您的计算机上本地缓存,因此您不必再次下载它
它会加载一次数据集,然后使用本地缓存的副本。
来源: http: //www.pyimagesearch.com/2014/09/22/getting-started-deep-learning-python/
编辑:有一些关于http://scikit-learn.org/stable/datasets/mldata.html的信息,例如
MNIST 数据库总共包含 70000 个大小为 28x28 像素的手写数字示例,标记为 0 到 9
和
第一次下载后,数据集本地缓存在 data_home 关键字参数指定的路径中,默认为 ~/scikit_learn_data/