0

有没有人在 Ubuntu 中使用过 cedergren 数据集。我有问题,因为我有 Ubuntu 操作系统。它基本上用于逻辑回归

http://nlp.stanford.edu/~manning/courses/ling289/cedegren-varbrul.html

将使用 glm 函数来查看它是如何在这个数据集上工作的

任何帮助表示赞赏!

4

1 回答 1

0
> require(utils)
> inp <- read.fwf(file=url("http://www-nlp.stanford.edu/~manning/courses/ling236/handouts/panama-mac.tok"), 
                 widths=rep(1, 5), colClasses=c("NULL", rep("factor",4) ) )
> str(inp)
'data.frame':   8955 obs. of  4 variables:
 $ V2: Factor w/ 3 levels "0","1","L": 2 2 2 2 2 2 2 2 2 2 ...
 $ V3: Factor w/ 6 levels "a","A","d","m",..: 4 4 4 4 4 4 4 4 4 4 ...
 $ V4: Factor w/ 4 levels "C","P","S","V": 1 1 1 1 1 1 1 1 1 1 ...
 $ V5: Factor w/ 5 levels "1","2","3","4",..: 1 1 1 1 1 1 1 1 1 1 ...

如果需要,您可以重命名这些列并为因素提供标签以使其更具自记录性,但可以按原样作为 glm 数据集运行。

于 2012-12-28T22:40:58.350 回答