3

我有来自 USGS Nation Water Data 网站的数据。我目前正在尝试绘制数据曲线并将其拟合到数据中,以用于预测数据集中进行的不同测量(溶解氧、pH、计高度和温度),所有这些都与放电率有关。我使用了“nls”命令,并且正在使用一本方程书来查找要使用的曲线……对于这个例子,我专门使用了舒马赫方程(书中第 48 页)。

找到数据链接:

曲线书:http ://www.for.gov.bc.ca/hfd/pubs/docs/bio/bio04.htm

data I used: http://waterdata.usgs.gov/mi/nwis/uv?referred_module=qw&search_station_nm=River%20Rouge%20at%20Detroit%20MI&search_station_nm_match_type=anywhere&index_pmcode_00065=1&index_pmcode_00060=1&index_pmcode_00300=1&index_pmcode_00400=1&index_pmcode_00095=1&index_pmcode_00010=1&group_key=NONE&sitefile_output_format= html_table&column_name=agency_cd&column_name=site_no&column_name=station_nm&range_selection=date_range&begin_date=2013-11-18&end_date=2013-12-18&format=html_table&date_format=YYYY-MM-DD&rdb_compression=file&list_of_search_criteria=search_station_nm,realtime_parameter_selection

我的问题是,一旦我选择了一条对其进行编码的曲线,我就无法让 nls 预测新值……我也不太清楚如何绘制它……我猜这可能与残差有关?在代码中,我使用“聚合”来提取列出的测量值和相应的放电率的平均值,现在我只需要让 R 为我预测。我得到了我认为合适的值......但我不确定,我用“?nls”碰壁了。

##Create new dataframes with means given date for each constituent
ph <- aggregate(Discharge~pH, data=River.Data, mean)

##pH models
pH <- ph$pH
disch <- ph$Discharge
phm <- nls(disch~exp(a+(b/pH)), data=ph, trace=T, start=list(a=-47.06 ,b=400.2))
newph<- data.frame(ph=c(3.0,4.0,5.0,6.0,7.0,8.0,9.0))
predict(phm, newdata=newph)
4

3 回答 3

3

似乎您已经得到了答案(??),但是:

ph    <- aggregate(Discharge~pH, data=River.Data, mean)
phm   <- nls(Discharge~exp(a+(b/pH)), data=ph, trace=T, start=list(a=-47.06 ,b=400.2))
newph <- data.frame(pH=seq(3,9,by=0.1))
Discharge.pred <- predict(phm, newdata=newph)

plot(ph$pH, ph$Discharge, xlim=c(3,9), ylim=c(0,1000))
par(new=t)
plot(newph$pH,Discharge.pred, xlab="", ylab="", axes=F, xlim=c(3,9), ylim=c(0,1000), type="l")

问题是您的数据是 [7.5,8.2] 中的 pH 值,但您试图在 [3,9] 中进行预测。您选择的模型对于远远超出范围的 pH 值是不稳定的。

于 2013-12-21T17:24:16.697 回答
1

贾罗德,试试这个。干杯,罗伯特。

#Try this
#pH <- ph$pH # you don't need this
#disch <- ph$Discharge # you don't need this
phm <- nls(Discharge~exp(a+(b/pH)), data=ph, trace=T, start=list(a=-47.06 ,b=400.2))
newph<- data.frame(pH=seq(3,9,0.1)) # it'll be smoother with a sequence in increments of 0.1
plot(newph,predict(phm, data=newph,type="l"))
于 2013-12-21T16:37:43.200 回答
0

该答案基于@Carl Witthoft 的评论。我在单独的答案中强调了这一点,因为我浏览了评论并没有真正接受卡尔的提议。希望它能帮助其他也在这里找到自己的人。

?predict.nls文件中,新数据需要是“命名列表或数据框”。这是我过去跌倒的地方;列表或数据框需要有一个名称。正如卡尔所说,这需要与模型中使用的名称完全相同。我认为OP的问题可能是因为它们pH在模型中使用,但ph在新数据的创建中。

于 2018-12-16T14:22:42.457 回答