我准备了一个带有 R 内置的模型glm
。创建模型后,我将model
and传递testData
给predict
函数。代码如下:
data = read.csv(file = "twitter-dataset.csv")
testData = read.csv(file = "twitter-test-dataset.csv")
model = glm(formula = viral ~ sentiment + postLength + hashTagCount + contentURLCount + likeCount + shareCount + followersCount + followingCount + tweetCount + gender + peakVelocity, data = data)
predict(model, testData)
predict 函数的输出是我不明白的。它包括NA
. 控制台上的示例输出predict
如下所示:
1 2 3 4 5 6 7
-0.261160126 -0.475512528 0.248612361 -0.384309806 -0.023267727 -0.238602913 NA
8 9 10 11 12 13 14
NA NA NA -0.225554686 NA -0.477842906 -0.192178793
15 16 17 18 19 20 21
NA -0.207955059 -0.172670264 NA -0.123026836 -0.026680875 0.120059375
22 23 24 25 26 27 28
这可能是什么原因?另外,我如何检查模型的准确性?
更新:
数据集:输入数据集
测试数据集:测试数据集