2

我在这里下载了 Gwern Branwen 数据集:https ://www.gwern.net/DNM-archives

我正在尝试读取 R 中的数据集,但遇到了很多麻烦。我试图打开数据集中名为“1776.tar.xz”的文件之一,我想我用 untar() “解压缩”了它,但我没有得到任何东西。

untar("C:/User/user/Downloads/dnmarchives/1776.tar.xz",
  files = NULL,
  list = FALSE, exdir = ".",
  compressed = "xz", extras = NULL, verbose = FALSE, restore_times = TRUE,
  tar = Sys.getenv("TAR"))

编辑:感谢到目前为止的所有评论!代码在 base R 中。我有多个从 Gwern 网站下载的数据集。我只是想打开一个探索。

4

3 回答 3

4

基础 R 包括功能untar。在我运行 R 3.6.2 的 Ubuntu 19.10 上,默认安装,以下就足够了。

fls <- list.files(pattern = "\\.xz")
untar(fls[1], verbose = TRUE)

笔记。
在这个问题中,“数据集”是单数的,但该网站上有几个数据集(复数)。下载我使用的文件

args <- "--verbose rsync://78.46.86.149:873/dnmarchives/grams.tar.xz rsync://78.46.86.149:873/dnmarchives/grams-20150714-20160417.tar.xz ./"
cmd <- "rsync"

od <- getwd()
setwd('~/tmp')

system2(cmd, args)
于 2020-02-07T07:12:48.357 回答
0

谢谢大家!不确定r有什么问题,但我重新安装了。我最终手动解压缩并加载文件。

于 2020-03-01T04:43:17.723 回答
-1
  1. 在 Debian 或 Ubuntu 上,首先安装包 xz-utils
$ sudo apt-get install xz-utils
  1. 提取 .tar.xz 的方式与提取任何 tar.__ 文件的方式相同。
$ tar -xf file.tar.xz

完毕。

于 2020-02-07T06:40:24.957 回答