我有一个 URL 列表,并提取了如下内容:
library(httr)
link="http://www.workerspower.net/disposable-workers-the-real-price-of-sweat-shop-labor"
get.link=GET(link)
get.content=content(x2,as="text")
extract.content=str_extract_all(y2,"<p>(.*?)</p>")
这给出了一个带有文本的“1 列表”。每个列表的长度取决于/随 URL 而变化。我想将 URL [链接] 与内容 [extract.content] 绑定并将其转换为数据框,然后将其导入语料库。我的尝试失败了,例如。由于行长不同,这不起作用:
all=data.frame(url.vec=c(link1,link2),text.vec=c(extract.content1,extract.content2))
有谁知道如何将字符 [向量] 与字符 [列表] 结合起来?