2

我终于让 imbdpy2sql 使用 Python 2.7 minGW 和 pymsql 在 Windows 7 上运行,它可以很好地连接到数据库并创建所有表,但它一直卡在 Flushind MoviesCache 上并且永远不会超过它。这是它的输出:

SAVING ImdbID values for ... DONE
DROPPING current database ... DONE
CREATING New tables ... DONE
SCANNING movies

它列出 10001 然后 20001 依此类推直到 90001 然后它说* FLUSHING MoviesCache

但它永远不会越过它。我应该让它像这样坐在那里多久?如果不是两个小时,我已经离开它至少一个小时没有任何进展。我能做些什么来让它工作吗?还是它在工作,我只需要让它坐几个小时?

此外,如果这有助于我通过打开命令提示符运行它,cding 到C:\Python27\Scripts\bin\然后使用此命令:

imdbpy2sql.py -d C:\USers\Jordan\DEsktop\IMDB -u mysql://root:lookool@localhost/IMDB
4

2 回答 2

1

不,这不正常:冲洗最多需要几十秒。

我会尝试重现它;同时,您可以尝试使用 CSV 导入系统:使用相同的选项再次运行 imdbpy2sql.py,添加“-c C:\Temp”(不带引号 - 或类似的东西:也许它需要两个反斜杠,用于目录分隔符,在 Windows 系统上)。

如果您可以访问 linux/unix 环境,您还可以使用 docs/goodies/ 目录中的 reduce.sh 脚本对部分数据集进行一些实验。

于 2012-01-09T07:50:13.773 回答
0

[MySQL]

一般来说,如果你得到一个令人尴尬的高数量的“TOO MANY DATA ... SPLITTING”行,考虑将 max_allowed_pa​​cket(在你的 MySQL 服务器的配置中)增加到至少 8M 或 16M。否则,插入数据会很慢,可能会丢失一些数据。

它写在他们的文档中:)

于 2013-01-05T02:59:34.823 回答