我决定尝试使用 odo来处理我的 csv 数据,因为据说它比使用 pandas 更快,但我无法让它工作。
这是他们关于将 30gb csv 文件迁移到 MySQL 数据库的文档:
In [1]: %time t = odo('all.csv', 'mysql+pymysql://localhost/test::nyc')
CPU times: user 1.32 s, sys: 304 ms, total: 1.63 s
Wall time: 20min 49s
我在我的 OS X El Capitan 上的本地 MySQL 实例中尝试了相同的操作,但它给了我以下错误:
/Library/Python/2.7/site-packages/PyMySQL-0.7.1-py2.7.egg/pymysql/err.pyc in _check_mysql_exception(errinfo)
113
114 # couldn't find the right error number
--> 115 raise InternalError(errno, errorvalue)
116
117
InternalError: (pymysql.err.InternalError) (13, u"Can't get stat of '/path/to/test.csv' (Errcode: 13 - Permission denied)") [SQL: u'LOAD DATA INFILE %(path)s\n INTO TABLE test_file2\n CHARACTER SET %(encoding)s\n FIELDS\n TERMINATED BY %(delimiter)s\n ENCLOSED BY %(quotechar)s\n ESCAPED BY %(escapechar)s\n LINES TERMINATED BY %(lineterminator)s\n IGNORE %(skiprows)s LINES\n '] [parameters: {'escapechar': '\\', 'encoding': 'utf8', 'skiprows': 1, 'delimiter': ',', 'lineterminator': u'\n', 'quotechar': '"', 'path': '/path/to/test.csv'}]
一开始以为是文件权限错误,后来发现表创建成功,列名正确,所以odo可以访问文件。所以,我真的不明白这个错误(13, u"Can't get stat of '/path/to/test.csv' (Errcode: 13 - Permission denied)")
我还能检查什么?