-2

我有大量数据,大约 2000 万行和 6 列。我正在尝试从这个大的 .csv 文件中提取数据。我尝试了 R,但我收到错误消息,我正在使用带有 4 GB Ram、i5 处理器的 macbook。有什么办法可以提取信息,我试过excel,只能取100万行。任何建议或帮助都会有用

文件超过 1.3 GB,我想根据一个参数将此数据库分成大约 2000-3000 个的集合。我尝试了 R,当我使用 read.csv 时,我尝试了一会儿,但在 10 分钟左右后,我得到 R 没有响应 –</p>

我想根据第三列分离这些数据。

SHA PCT PRACTICE BNF 代码 BNF 名称

4

2 回答 2

5

首先,您必须说明提取数据是什么意思。如果它是某种聚合函数或者它可以被分割,那么我认为最简单的方法是将你巨大的 csv 文件分割成许多小的文件。

如果您需要其他东西,请看这里:

于 2013-05-13T09:50:05.387 回答
0

我会将它转储到 SQL 数据库(mySQL、postgre、SQLlite 并使用您可以在 RODBC 包中找到的 ODBC 驱动程序进行调用(JDBC 也可以)。

然后你可以做一个'SELECT * FROM your_table WHERE column_3= X;'

祝你好运!

[链接到教程1

于 2013-05-16T01:35:02.093 回答