我有以下代码来规范我的文档。我的文档包含以下方法来规范化我的SmallShuffledTrainingData
CSV。
static void Normalize()
{
Console.WriteLine("Normalizing...");
var analyst = new EncogAnalyst();
var wizard = new AnalystWizard(analyst);
wizard.Wizard(SmallShuffledTrainingData, true, AnalystFileFormat.DecpntComma);
// customer id
analyst.Script.Normalize.NormalizedFields[0].Action = Encog.Util.Arrayutil.NormalizationAction.PassThrough;
var norm = new AnalystNormalizeCSV();
norm.Analyze(SmallShuffledTrainingData, true, CSVFormat.English, analyst);
norm.ProduceOutputHeaders = true;
norm.Normalize(SmallShuffledTrainingDataNormalized);
analyst.Save(AnalystFile);
}
我只是想规范一列,因为它需要很长时间。
我的文档有 332k 行和 25 列。
除了将其分解为越来越小的文档之外,还有什么方法可以加快规范化过程?
如果我确实将其分解,我怎么可能将它们组合成一个文档,因为规范化需要查看所有记录以找到给定列的最高和最低值?