0

我正在尝试清理此(旧)电子表格中的数据,并且需要删除单引号和双引号、HTML 标记等内容。麻烦的是,它是一个 3000 行的文件,有 25 列,我尝试过的每个电子表格应用程序(NeoOffice、MS Excel、Apple Numbers)都会被它阻塞。难的。

关于如何清理这个东西以导入 MySQL 的任何想法?显然,我可以逐行手动浏览每条记录,但如果可能的话,我想避免这种情况。同样,我可以编写一个 PHP 脚本在导入时处理它,但也不想让服务器陷入死循环。

4

2 回答 2

0

如果它是 Excel 格式,您可以尝试通过 python 访问它。

http://www.python-excel.org/

我自己从来没有这样做过,但它可能适用于你的情况。

于 2009-08-14T00:30:31.777 回答
0

我找到了一个解决方案:将电子表格导出为 CSV,在我的桌面上运行 PHP 和 MySQL,我使用“LOAD DATA”SQL 命令将 csv 文件导入 MySQL,然后使用 PHP + MySQL 清理每一行。比要求 Excel 或 Numbers 等桌面应用程序进行查找和替换要快得多。

于 2009-08-14T02:20:19.953 回答