0

我想在 X_test 和 y_test 中删除 MFD 较大的每一行。问题是,我总是从训练/测试/拆分中获得随机混合索引。如果我尝试删除它,我会收到以下错误消息:

IndexError:索引 3779 超出轴 1 的范围,大小为 3488

我不能使用旧索引来删除它,但是我怎样才能获得 MFD > 1 的新索引

  X_train, X_test, y_train, y_test = train_test_split(X, y, 
                                                test_size=test_size, 
                                                random_state=random_state, 
                                                stratify=y)



mfd_drop_rows = []
i_nr = 0
for i in X_test.MFD:
   if (i > 1): 
      mfd_drop_rows.append(X_test.index[i_nr])
   i_nr += 1


X_test_new = X_test.drop(X_test.index[mfd_drop_rows]) 
y_test_new = Y_test.drop(Y_test.index[mfd_drop_rows]) 

感谢您的帮助(=

4

2 回答 2

0

我已经解决了,我只是使用我的 i_nr 迭代并拥有新的指数。

感谢所有阅读它的人

mfd_drop_rows = []
i_nr = 0
for i in X_test.MFD:
 if (i > 1): 
    mfd_drop_rows.append(i_nr)
 i_nr += 1


 X_test_new = X_test.drop(X_test.index[mfd_drop_rows]) 
 y_test_new = Y_test.drop(Y_test.index[mfd_drop_rows]) 
于 2018-04-17T13:46:14.643 回答
0

不确定 MFD 是什么,但假设它X_test.MFD为您提供了一个数字数组,您可以使用掩码删除行。可以在这里看到如何使用掩码的简单示例:

x = [[1,2,3,4,5],[6,7,8,9,10]]
mfd = [0.6, 1.3]
mask = x > 1
x_new = x[mask,:]

这将给出:

x = [1,2,3,4,5
     6,7,8,9,10]
mask = [False, True]
x_new = [6,7,8,9,10]
于 2018-04-17T13:56:44.797 回答