我有一个(相当长的)向量列表。这些向量由我通过strsplit()
在句子上使用函数得到的俄语单词组成。
以下是head()
返回的内容:
[[1]]
[1] "модно" "создавать" "резюме" "в" "виде"
[[2]]
[1] "ты" "начианешь" "работать" "с" "этими"
[[3]]
[1] "модно" "называть" "блогер-рилейшенз" "―" "начинается" "задолго"
[[4]]
[1] "видел" "по" "сыну," "что" "он"
[[5]]
[1] "четырнадцать," "я" "поселился" "на" "улице"
[[6]]
[1] "широко" "продолжали" "род."
请注意,向量的长度不同。
我想要的是能够从每个句子中读取第一个单词,第二个单词,第三个单词等。
期望的结果是这样的:
P1 P2 P3 P4 P5 P6
[1] "модно" "создавать" "резюме" "в" "виде" NA
[2] "ты" "начианешь" "работать" "с" "этими" NA
[3] "модно" "называть" "блогер-рилейшенз" "―" "начинается" "задолго"
[4] "видел" "по" "сыну," "что" "он" NA
[5] "четырнадцать," "я" "поселился" "на" "улице" NA
[6] "широко" "продолжали" "род." NA NA NA
我试图只使用data.frame()
,但这没有用,因为行的长度不同。rbind.fill()
我也从包中尝试过plyr
,但该函数只能处理矩阵。
我在这里发现了一些其他问题(这就是我得到plyr
帮助的地方),但这些都是关于组合例如两个不同大小的数据框。
谢谢你的帮助。