2

我想使用这个readr包,因为我将来会处理一些更大的文件。我的问题是,有一个名为的列Intensity具有一些非常大的值(例如5493500000)。我的问题是,第一次出现这个大值是在第 2200 行,并且readr已经将列定义为integer而不是numeric并产生缓冲区溢出。

有没有办法只为函数提供一个列类型read_tsv,因为我不想为所有(大约)40 列提供正确的类型。

任何帮助操作系统表示赞赏。

4

1 回答 1

3

您需要参数col_types = cols(Intensity = col_double()),根据手册,这将防止基于前 1000 行的列类型的插补。如果您只想要列的子集,请使用cols_only.

于 2016-08-11T11:14:14.653 回答