Find centralized, trusted content and collaborate around the technologies you use most.
Teams
Q&A for work
Connect and share knowledge within a single location that is structured and easy to search.
我有一个自定义数据集,我想将该数据集拆分为“训练”和“测试”集(如果可能,也可能是“验证”集)。我将如何使用 Flux.jl 或其他 Julia 机器学习包来实现这一点?
TrainTestSplit您可以从 Lathe 包中导入函数,如下所示:
TrainTestSplit
using Lathe.preprocess: TrainTestSplit
然后在你的代码中实现它,例如:
dataset_id = TrainTestSplit(datasetmap[:], 0.8); #datasetmap is your label encoded matrix
我假设您使用的是 Pluto notebook,但它也应该在任何其他环境中工作,例如 jupyter、atom 等。