我想使用 patsy 的dmatrix
函数来生成一个设计矩阵,其中保留了具有 NaN 值的行。例如,下面的代码将返回一个四行的设计矩阵,这是我们通常想要的。但是,在这种情况下,我想dmatrix
返回一个包含五行的矩阵,其中第一行将有一个 NaN 值。
import numpy as np
import pandas as pd
from patsy import dmatrix
df = pd.DataFrame({'x1': np.arange(5), 'x2': np.arange(5)})
dmatrix("~x1+x2.diff()", df)
或者,我会选择一个允许我检索已删除/保留的行号的答案。在上面的示例中,第 1 行是被删除的行,而第 2-5 行被保留。