我正在尝试使用包中的大量旧版 Excel 97-2003 文件 ( .xls
) 。这些文件中的一列是带有一些空格的字母数字代码(例如,等)。在原始 Excel 文件中,该列中仅包含数字的单元格具有of,而包含字母和空白单元格的单元格具有of 。read_excel()
readxl
"", "1", "1A", "1B", "2", "3", "3A"
TYPE()
1
TYPE()
2
当我使用 读取文件read_excel()
时,数据框中的相应列会自动转换为类型chr
(这是我想要的),但是只包含数字的元素最终被编码为小数,所以我最终得到"", "1.000000", "1A", "1B", "2.000000", "3.000000", "3A"
等。强制转换为文本read_excel(..., coltypes = c(...,"text",...)
似乎没有任何区别。
我可以通过一些小技巧轻松修复生成的数据框regex
,但是有没有办法首先避免这种情况?