这是我在 R 中使用机器学习范式的第一次尝试。我正在使用行星数据集(网址:https ://www.kaggle.com/mrisdal/open-exoplanet-catalogue ),我只是想预测一个行星的大小基于其太阳的大小。这是我目前拥有的代码,使用 nnet():
library(nnet)
#Organize data:
cols_to_keep = c(1,4,21)
full_data <- na.omit(read.csv('Planet_Data.csv')[, cols_to_keep])
#Split data:
train_data <- full_data[sample(nrow(full_data), round(nrow(full_data)/2)),]
rownames(train_data) <- 1:nrow(train_data)
test_data <- full_data[!rownames(full_data) %in% rownames(data1),]
rownames(test_data) <- 1:nrow(test_data)
#nnet
nnet_attempt <- nnet(RadiusJpt~HostStarRadiusSlrRad, data=train_data, size=0, linout=TRUE, skip=TRUE, maxNWts=10000, trace=FALSE, maxit=1000, decay=.001)
nnet_newdata <- predict(nnet_attempt, newdata=test_data)
nnet_newdata
当我打印 nnet_newdata 时,我会为数据中的每一行得到一个值,但我并不真正理解这些值的含义。这是使用 nnet() 包预测简单回归的正确方法吗?
谢谢