我有一个非常大的数据集,其尺寸由(203,000 x 150)给出,其中一些列(属性)有大量缺失值,用 NA 表示。我需要从中采样一个较小的数据集,以便我可以在我的计算机上运行测试。关于如何最好地做到这一点的任何建议?我对这个领域很陌生,因此没有太多的专业知识。
谢谢,
我有一个非常大的数据集,其尺寸由(203,000 x 150)给出,其中一些列(属性)有大量缺失值,用 NA 表示。我需要从中采样一个较小的数据集,以便我可以在我的计算机上运行测试。关于如何最好地做到这一点的任何建议?我对这个领域很陌生,因此没有太多的专业知识。
谢谢,