我正在研究机器学习(图像分类),我发现一个包含两个文件的数据集:
- 图像(20,000 张图像)“图像”图像编号从 1 到 20,000(未分类)”
- 包含图像信息和分类的 JSON 文件(12 类图像) JSON 文件的结构如下:
{
"<image_number>": {
"image_filepath": "images/<image_number>.jpg",
"anomaly_class": "<class_name>"
},
...
}
所以我正在尝试读取 JSON 文件并拆分数据集,以便我可以单独处理每个类。然后将“每个类”的 80% 作为训练集,将 20% 作为测试集
我试图找到一种将 JSON 文件与数据集(图像)匹配的方法,因此我可以对各个文件夹中的类进行分类,然后将它们划分为训练集和测试集
任何人都可以帮助我吗?
谢谢你