0

我正在上一门关于算法和数据结构的课程,对于我的作业,建议我在提交之前做很多统计测试。我的测试主要针对执行时间、生成输出的随机性等。我正在查看 R 以获取我的数据的图形表示。

我想知道 R喜欢从哪些文件中读取数据,以及哪些文件可以在 java 中轻松创建。

我看到很多人将 csv 文件提供给 R ,为此我需要类似 java 中的 openCSV 库之类的东西。另外,与 csv-s 相比,用于相同目的的分隔符分隔的 .txt 文件有多好/坏?

编辑: 嗯,当我说喜欢时,我真的没有将 R 或任何东西拟人化......只是我认为这是表达我感受的最佳方式。我在 R 的页面某处读到 excel 表不是一个好的选择,尤其是2007 年邮局的那个。再加上生活真的可以这么简单的想法吗?,我找到了我正在寻找的软件,她接受了我不起眼的制表符分隔的文本文件,并把我想要的一切都还给了我?看起来好得令人难以置信。

我感谢大家的回答,R 似乎对数据导入文件类型是公正的。

4

2 回答 2

1

这里的答案是 R 并不真正“喜欢”任何东西。它非常适合处理多种数据格式。

  • CSV 文件:read.csvread.csv2取决于您的 CSV 文件具有的分隔符。
  • 分隔文件:read.delimread.delim2取决于您拥有的小数分隔符。这里的选项卡是默认选项,但原则上可以是任何选项。甚至一个,或;。
  • 固定宽度格式文件:read.fwf也使用制表符作为默认分隔符。

那应该给你一些想法。

于 2013-09-05T07:11:01.943 回答
-1

如果您有非常大的数据集,我建议您使用 SQL 变体。有了它,你可以很容易地选择子集。当然,您必须先将其转换为数据库格式,可以通过执行以下操作来完成:

LOAD DATA LOCAL INFILE 'csvTest.csv'
INTO TABLE csvImport
FIELDS TERMINATED BY ';'
ENCLOSED BY '"'
LINES TERMINATED BY '\n'
IGNORE 1 LINES

(见http://code.dedu.ch/2011/07/csv-file-direkt-in-mysql-importieren/,不幸的是德语教程,但那里提供的代码应该足够了。)

编辑:忘记附上 SQL 包链接: http ://cran.r-project.org/web/packages/RMySQL/index.html

在所有其他情况下,R 不喜欢任何数据。您只需要像其他人建议的那样正确配置阅读过程。

于 2013-09-05T07:16:44.807 回答