当我使用 ATIS(航空公司旅行信息系统)数据集(http://lisaweb.iro.umontreal.ca/transfert/lisa/users/mesnilgr/atis/)进行循环神经网络研究时。我对它的结构感到困惑。
例如,使用data = pickle.load(open("./dataset/atis.fold0.pkl", "rb"),encoding='iso-8859-1')
加载atis.fold0.pkl后,我使用print (np.shape(data_train))
获取(4,)
. 我认为data[0]是训练集,data[1]是有效集,data[2]是测试集,data[3]是dict。
但是当我使用时print(np.shape(data[0]))
,我得到了(3, 3983)
。我想知道为什么我在其中得到 3 行?这三行有什么区别。
文件 atis.fold0.pkl、atis.fold1.pkl、atis.fold2.pkl、atis.fold3.pkl、atis.fold4.pkl 有什么区别?