0

我有 7500 条消息,每条消息都有对应的唯一 ID 号。我已将消息分成季节,并有一个季节消息块:2013 年冬季 ----> 2014 年春季。我希望创建一个代表整个时期的 1000 条消息的样本,所以我将从 5 个赛季中的每个赛季中获取 200 条消息。

我使用以下代码对唯一 ID 进行了采样:

s1    <-  sample(data$id[w13], size = 200, replace = FALSE)
s2   <-  sample(data$id[sp13], size = 200, replace = FALSE)
s3   <-  sample(data$id[su14], size = 200, replace = FALSE)
s4    <-  sample(data$id[a14], size = 200, replace = FALSE)
s5   <-  sample(data$id[w14], size = 200, replace = FALSE)
然后我使用以下代码将它们附加到长度为 1000 的一个因子中:

id.sample    <-   unlist(list(s1,s2,s3,s4,s5))

现在我想检索与这些 ID 对应的消息。我正在使用以下代码,但这不起作用。

message.sample <-   data$text[data$id==id.sample]

我究竟做错了什么?

4

1 回答 1

0

message.sample= data[data$id %in% id.sample] 使用后你会得到所有的列。从中您可以选择所需的列。

于 2015-01-16T04:29:09.510 回答