2

我正在尝试将文件中的模拟结果加载到向量中。该代码适用于中小型数据量。当我尝试加载大文件时,出现异常。使我的程序崩溃的数组大约是 17000*7*3000 个元素。我尝试将初始化分成几个步骤,但它也崩溃了。你能告诉我我是否可以做点什么让它工作吗?

//////////////////////////////////////////////////////////
//Import of surface receivers file
    for(int freq=0;freq<7;freq++)
    {
        filePath=filePath_old;

        filePath.Replace(wxT("125 Hz"),wxString::Format(wxT("%i"), freqSTI[freq])+wxT(" Hz"));
        if(importer.ImportBIN(filePath,mainData))
        {
            if(timeTable.size()==0){
                for(int idstep=0;idstep<mainData.nbTimeStep;idstep++)
                {
                    timeTable.push_back(mainData.timeStep*(idstep+1)*1000);
                }
            }
            for(wxInt32 idrs=0;idrs<mainData.tabRsSize;idrs++)
            {
                for(wxInt32 idface=0;idface<mainData.tabRs[idrs].dataRec.quantFaces;idface++)
                {
                    if(tab_wj.size()<idrs+1){
                        tab_wj.push_back(std::vector<std::vector<std::vector<wxFloat32> > > (mainData.tabRs[idrs].dataRec.quantFaces,std::vector<std::vector<wxFloat32> >(7,std::vector<wxFloat32>(mainData.nbTimeStep,0.f))));
                    }
                    //Pour chaque enregistrement de cette face
                    int tmp=mainData.tabRs[idrs].dataFaces[idface].dataFace.nbRecords;
                    for(wxInt32 idenr=0;idenr<mainData.tabRs[idrs].dataFaces[idface].dataFace.nbRecords;idenr++)
                    {
                        t_faceValue* faceval=&mainData.tabRs[idrs].dataFaces[idface].tabTimeStep[idenr];
                        tab_wj[idrs][idface][freq][faceval->timeStep]=faceval->energy;
                    }
                }
            }
        }

    }

发生异常的地方是tab_wj.push_back...

当我试图将初始化分成多个步骤时,我写道:

std::vector<wxFloat32> t1(mainData.nbTimeStep,0.f);
std::vector<std::vector<wxFloat32> > t2(7,t1);
std::vector<std::vector<std::vector<wxFloat32> > > t3(mainData.tabRs[idrs].dataRec.quantFaces,t2);

然后它在这些行中的最后一条崩溃了。

谢谢你的帮助!

4

1 回答 1

1

看起来它在分配内存时遇到了异常。std::vector<> 必须在您向其中添加新项目时重新分配其存储空间。它不会为每个 push_back() 执行此操作,因为它分配的比它需要的多。大小为 5 的向量<> 实际上可能有 8 个项目的空间(大小()与容量())。当您插入第 9 个项目时,它必须重新分配,通常它的容量会加倍(从 8 到 16 (*))。

这种重新分配可能会使您的堆碎片化。为了改进,您可以将向量预分配到它最终需要的大小,因此它永远不需要重新分配。vector::reserve() 所以,如果你知道你最终将需要 17000*7*3000,请预先保留它。

此外,如果您有很多小向量,则以较小的大小分配这些向量可以减少您的内存需求。通常 vector<> 的默认大小可以是 8 或 16。如果您只插入 3 个项目,那么您会浪费大量存储空间。在分配向量期间,我相信您可以指定其初始容量。

由于您使用的是嵌套向量,因此这些向量中的每一个都会有自己的分配。根据您的 C++ 版本,将向量推入向量可能会导致多次分配。

您可以尝试重组代码以不需要嵌套向量。

(*):一个简单的向量实现在需要更多空间时会将分配大小加倍,但由于多种原因,1.6 倍更好(它与 big-O 效率一样高,并且导致内存碎片更少)。参见“黄金比例”:https ://en.wikipedia.org/wiki/Golden_ratio

于 2015-07-28T21:25:28.017 回答