1

我经常在 Excel 工作簿的许多工作表中将数据作为“漂亮的表格”。“漂亮”是指每个工作表的顶部和底部都有说明性文本,标题有合并的单元格,标题和第一个数据行之间有空白行,数据列之间有空白列等。

这是一个罪犯的一部分的屏幕截图。

这里有减少体力劳动的最佳实践吗?

一种方法是在 Excel 中修复所有这些表。另一种可能是将“原样”保存到制表符分隔的 txt,手动选择和导入数据行,删除空白列,然后手动输入标题信息。我倾向于后者,但即使这是相当手动的。

高手在做什么?当我这样做时,我感觉自己就像一个不知道剪切和粘贴的人。

FWIW,我在大多数事情上都使用 Python、Stata 和 R,但我对任何可以简化此过程的工具持开放态度。谢谢!

4

1 回答 1

2

老实说,我在清理数据过程中使用的自动化程度取决于我必须执行的次数。对我来说,我认为通过宏修改 Excel 中的文件。

如果您的文件始终具有相同的格式(对于特定任务),您可以简单地记录您正在执行的清理它们的步骤的宏,并将它们保存在您的个人工作簿中

如果它们略有不同但主题有所不同,您可以修改录制的 marco(理想情况下分解为类似的函数DeleteTopRows,并且DeleteEmptyColumns根据输入文件接受不同的参数)

我认为 Excel VBA 是这类工作最容易工作的地方,因为 excel 应用程序可以帮助处理许多内置函数。例如,在您上面的工作表Range("10:11").Delete中将删除它们。

于 2012-11-16T01:48:33.087 回答