我需要:
使用每个公司名称运行查询以下载每个公司信息的解析文件(例如,Federation_year、资助者公司名称),使用语法“ http://api.crunchbase.com/v/1/company/permalink.js ”
我想将这些数据解析为电子表格或其他格式,然后我可以将其导入 R 进行分析。
将此数据导入 R 的最佳格式是什么?如何下载数据并将其组织成类似表格的结构?(例如,行 = 公司,列 = 个人资料信息,如 funded_year)(最终目标是在 R 中分析它)
我需要:
使用每个公司名称运行查询以下载每个公司信息的解析文件(例如,Federation_year、资助者公司名称),使用语法“ http://api.crunchbase.com/v/1/company/permalink.js ”
我想将这些数据解析为电子表格或其他格式,然后我可以将其导入 R 进行分析。
将此数据导入 R 的最佳格式是什么?如何下载数据并将其组织成类似表格的结构?(例如,行 = 公司,列 = 个人资料信息,如 funded_year)(最终目标是在 R 中分析它)
library(RJSONIO)
library(RCurl)
# grab the data
raw_data <- getURL("http://api.crunchbase.com/v/1/companies.js")
# Then covert from JSON into a list in R
data <- fromJSON(raw_data)
length(data)
[1] 101782
# We can coerce this to a data.frame
final_data <- do.call(rbind, data)
# Then write it to a flat csv file
write.csv(final_data, "final_data.csv")
> head(final_data)
name permalink category_code
[1,] "Wetpaint" "wetpaint" "web"
[2,] "AdventNet" "adventnet" "enterprise"
[3,] "Zoho" "zoho" "software"
[4,] "Digg" "digg" "web"
[5,] "Facebook" "facebook" "web"
[6,] "Photobucket, Inc." "photobucket" "web"