我的问题在下面,但是任何有 xlrd 经验的人都会感兴趣的评论。
我刚刚找到 xlrd,它看起来像是完美的解决方案,但我在开始时遇到了一点问题。我正在尝试以编程方式从我从道琼斯提取的 Excel 文件中提取数据,其中包含道琼斯工业平均指数的当前成分(链接:http ://www.djindexes.com/mdsidx/?event=showAverages )
当我打开未修改的文件时,出现令人讨厌的 BIFF 错误(无法识别二进制格式)
但是,您可以在此屏幕截图中看到 Excel 2008 for Mac 认为它是“Excel 1997-2004”格式(屏幕截图:http ://skitch.com/alok/ssa3/componentreport-dji.xls-properties )
如果我改为手动在 Excel 中打开它并明确保存为“Excel 1997-2004”格式,然后在 python usig xlrd 中打开,一切都很好。请记住,Office 认为该文件已经是“Excel 1997-2004”格式。所有文件都是 .xls
这是复制问题的 ipython 会话的 pastebin:http: //pastie.textmate.org/private/jbawdtrvlrruh88mzueqdq
任何想法:如何欺骗 xlrd 识别文件以便我可以提取数据?如何使用 python 将显式“另存为”格式自动化为 xlrd 将接受的格式?B计划?