48

我很惊讶地看到 R 在连接向量时会将因子强制转换为一个数字。即使级别相同,也会发生这种情况。例如:

> facs <- as.factor(c("i", "want", "to", "be", "a", "factor", "not", "an", "integer"))
> facs
[1] i       want    to      be      a       factor  not     an      integer
Levels: a an be factor i integer not to want
> c(facs[1 : 3], facs[4 : 5])
[1] 5 9 8 3 1

在 R 中执行此操作的惯用方法是什么(在我的情况下,这些向量可能非常大)?谢谢你。

4

9 回答 9

39

R 邮件列表

unlist(list(facs[1 : 3], facs[4 : 5]))

要“绑定”因子,请执行

data.frame(facs[1 : 3], facs[4 : 5])
于 2011-02-21T17:08:54.230 回答
10

另一种解决方法是将因子转换为字符向量,然后在完成连接时转换回来。

cfacs <- as.character(facs)
x <- c(cfacs[1:3], cfacs[4:5]) 

# Now choose between
factor(x)
# and
factor(x, levels = levels(facs))
于 2010-08-10T13:25:07.477 回答
8

fct_cforcats包装中使用( tidyverse的一部分)。

> library(forcats)
> facs <- as.factor(c("i", "want", "to", "be", "a", "factor", "not", "an", "integer"))
> fct_c(facs[1:3], facs[4:5])
[1] i    want to   be   a
Levels: a an be factor i integer not to want

fct_c不会被具有不同数字编码的因子串联所迷惑:

> x <- as.factor(c('c', 'z'))
> x
[1] c z
Levels: c z
> y <- as.factor(c('a', 'b', 'z'))
> y
[1] a b z
Levels: a b z
> c(x, y)
[1] 1 2 1 2 3
> fct_c(x, y)
[1] c z a b z
Levels: c z a b
> as.numeric(fct_c(x, y))
[1] 1 2 3 4 2
于 2018-05-15T23:36:33.470 回答
6

哇,我从来没有意识到它会这样做。这是一个解决方法:

x <- c(facs[1 : 3], facs[4 : 5]) 
x <- factor(x, levels=1:nlevels(facs), labels=levels(facs))
x

输出:

[1] i    want to   be   a   
Levels: a an be factor i integer not to want

仅当两个向量具有与此处相同的级别时,它才会起作用。

于 2010-08-09T19:55:27.623 回答
4

这是一个非常糟糕的 R 陷阱。沿着这些思路,这里有一个刚刚吞噬了我几个小时的时间。

x <- factor(c("Yes","Yes","No", "No", "Yes", "No"))
y <- c("Yes", x)

> y
[1] "Yes" "2"   "2"   "1"   "1"   "2"   "1"  
> is.factor(y)
[1] FALSE

在我看来,更好的解决方法是 Richie's,它强制角色。

> y <- c("Yes", as.character(x))
> y
[1] "Yes" "Yes" "Yes" "No"  "No"  "Yes" "No" 
> y <- as.factor(y)
> y
[1] Yes Yes Yes No  No  Yes No 
Levels: No Yes

正如里奇所说,只要您正确设置了级别。

于 2014-03-31T14:53:37.160 回答
2

基于使用转换为字符的其他答案,我使用以下函数来连接因子:

concat.factor <- function(...){
  as.factor(do.call(c, lapply(list(...), as.character)))
}

您可以像使用c.

于 2016-10-19T08:29:54.553 回答
1

只是一个简短的说明,指出从 R 4.1.0 开始,这直接在基础 R 中解决。你现在可以直观地做

c(facs[1 : 3], facs[4 : 5])
于 2021-07-20T00:29:34.127 回答
1

出于这个原因,我更喜欢使用 data.frames 中的因素:

df <- data.frame(facs = as.factor(
      c("i", "want", "to", "be", "a", "factor", "not", "an", "integer") ))

并使用 subset() 或 dplyr::filter() 等对其进行子集化,而不是行索引。因为在这种情况下我没有有意义的子集标准,所以我将只使用 head() 和 tail():

df1 <- head(df, 4)
df2 <- tail(df, 2)

然后你可以很容易地操纵它们,例如:

dfc <- rbind(df1, df2)
dfc$facs
#[1] i       want    to      be      an      integer
#Levels: a an be factor i integer not to want
于 2017-05-31T13:54:53.260 回答
0

当设置略有不同时,这是添加到因子变量的另一种方法:

facs <- factor(1:3, levels=1:9,
               labels=c("i", "want", "to", "be", "a", "factor", "not", "an", "integer"))
facs
# [1] i       want    to      be      a       factor  not     an      integer
# Levels: a an be factor i integer not to want
facs[4:6] <- levels(facs)[4:6]
facs
# [1] i      want   to     be     a      factor
# Levels: i want to be a factor not an integer
于 2016-11-05T15:49:53.863 回答