0

我目前正在做一个机器学习项目(一个非常基础的项目),并使用 1871-2015 年的棒球数据。我想使用一组特定的年份来测试我的预测。我正在使用 dfply 包,然后使用 mask 命令取出某一年,但我需要的不仅仅是取出一年。我该怎么办?

先感谢您。

我尝试使用“或”和“|” 以及添加 () 和 []。

import pandas as pd

import numpy as np 

import sklearn

from sklearn import linear_model

from sklearn.utils import shuffle

import matplotlib.pyplot as pyplot

import pickle 

from matplotlib import style

from dfply import *

import statsmodels.api as sm

import statsmodels.formula.api as smf

data = pd.read_csv("team.csv")

data_test = (data >>  mask(X.year == 1997))

我希望 X.year 从 1997 年到 2015 年。

4

1 回答 1

0

假设您的 中有一个列yearpandas.DataFrame这应该有效:

data_test = data[data.year == 1997]
于 2019-10-02T14:01:47.660 回答