我正在尝试找到数据框的相关系数并完美地工作。
使用 cor() 从数据帧中查找相关系数是否有问题,或者为大数据实现此代码是否很好?
cc = function(input, output = NULL){
cc.map = function(., v)
{
data <- v[-1,]
data[,1:length(data)] = lapply(data[,1:length(data)], as.numeric)
keyval("korelasi",data)
}
cc.reduce =function(k, v )
{
keyval(k, cor(v))
}
mapreduce(
input = input ,
output = output,
input.format = make.input.format("csv",sep=",",fill = TRUE,stringsAsFactors=FALSE),
map = cc.map,
reduce = cc.reduce,
combine = T)}