5谁能给我一个提示以加快以下程序的速度?情况:我有大量的测量数据。我需要提取 5 个参数(即列值)的“10 分钟稳定运行条件”的数据。
这是我的(工作,但非常慢)解决方案: - 从数据框中获取前 10 行 - 将每列的最小值和最大值与列的第一个值进行比较 - 如果至少一列最小值或最大值不在公差范围内,删除第一行,重复 - 如果它们在公差范围内,计算结果的平均值,存储它们,删除 10 行,重复。- 当数据框少于 10 行时中断
由于我使用的是重复循环,因此从 86.220 分钟的数据中提取 610 个操作点需要 30 分钟。
任何帮助表示赞赏。谢谢!
编辑:我创建了一些代码来解释。请注意,我删除了 na 值和待机操作的检查例程(值在 0 左右):
n_cons<-5 # Number of consistent minutes?
### Function to check wheter a value is within tolerance
f_cons<-function(min,max,value,tol){
    z<-max > (value + tol) | min < (value - tol);    
    return(z)
}
# Define the +/- tolerances
Vu_1_tol<-5 # F_HT
Vu_2_tol<-5 # F_LT
# Create empty result map
map<-c(rep(NA,3))
dim(map)<- c(1,3)
colnames(map)<-list("F_HT","F_LT","Result")
system.time(
    repeat{
        # Criteria to break
        if(nrow(t6)<n_cons){break}
        # Subset of the data to check
        t_check<-NULL
        t_check<-cbind(t6$F_HT[1:n_cons],
                       t6$F_LT[1:n_cons]
        )
        # Check for consistency
        if(f_cons(min(t_check[,1]),max(t_check[,1]),t_check[1,1],Vu_1_tol)){t6<-t6[-1,]
                                                                                     next}
        if(f_cons(min(t_check[,2]),max(t_check[,2]),t_check[1,2],Vu_2_tol)){t6<-t6[-1,]
                                                                                     next}
        # If the repeat loop passes the consistency check, store the means
        attach(t6[1:n_cons,])
        # create a new row wih means of steady block
        new_row<-c(mean(F_HT),mean(F_LT),mean(Result))
        new_row[-1]<-round(as.numeric(new_row[-1]),2)
        map<-rbind(map,new_row) # attach new steady point to the map
        detach(t6[1:n_cons,])
        t6<-t6[-(1:n_cons),] # delete the evaluated lines from the data
    }
)
我使用的数据看起来像这样
t6<-structure(list(F_HT = c(1499.71, 1500.68, 1500.44, 1500.19, 1500.31, 
1501.76, 1501, 1551.22, 1500.01, 1500.52, 1499.53, 1500.78, 1500.65, 
1500.96, 1500.25, 1500.76, 1499.49, 1500.24, 1500.47, 1500.25, 
1735.32, 2170.53, 2236.08, 2247.48, 2250.71, 2249.59, 2246.68, 
2246.69, 2248.27, 2247.79), F_LT = c(2498.96, 2499.93, 2499.73, 
2494.57, 2496.94, 2507.71, 2495.67, 2497.88, 2499.63, 2506.18, 
2495.57, 2504.28, 2497.38, 2498.66, 2502.17, 2497.78, 2498.38, 
2501.06, 2497.75, 2501.32, 2500.79, 2498.17, 2494.82, 2499.96, 
2498.5, 2503.47, 2500.57, 2501.27, 2501.17, 2502.33), Result = c(9125.5, 
8891.5, 8624, 8987, 9057.5, 8840.5, 9182, 8755.5, 9222.5, 9079, 
9175.5, 9458.5, 9058, 9043, 9045, 9309, 9085.5, 9230, 9346, 9234, 
9636.5, 9217.5, 9732.5, 9452, 9358, 9071.5, 9063.5, 9016.5, 8591, 
8447.5)), .Names = c("F_HT", "F_LT", "Result"), row.names = 85777:85806, class = "data.frame")
有了这段代码和数据,我得到了 3 个稳定的操作点,这是我想要的,但是很慢。
希望这有助于更好地解释我的问题。