4

我正在使用 Mask-RCNN 并希望训练我自己的可可风格数据集,其中包含几个类别。首先,我只有 2 个类(除了背景)。

虽然 Mask-RCNN 带有样本数据集,但它们要么只包含一个类,要么自己生成数据,这让我无法理解如何加载带注释的图像并开始训练。我一直在 Python 函数上花费大量时间,但不断收到错误,例如:

TypeError: list indices must be integers or slices, not str

这让我几乎一无所知。

我拥有的当前加载器(加载我的可可样式数据集)如下(来自 Mask R-CNN 存储库中的可可加载器)

 def load_components(self, dataset_dir, subset, year=DEFAULT_DATASET_YEAR):

    coco = COCO("{}/annotations/instances_{}{}.json".format(dataset_dir, subset, year))
    if subset == "minival" or subset == "valminusminival":
        subset = "val"
    image_dir = "{}/{}{}".format(dataset_dir, subset, year)

    # Load all classes or a subset?
    class_ids = sorted(coco.getCatIds())

    # All images or a subset?
    image_ids = list(coco.imgs.keys())

    # Add classes
    for i in class_ids:
        self.add_class("coco", i, coco.loadCats(i)[0]["name"])

    # Add images
    for i in image_ids:
        self.add_image(
            "coco", image_id=i,
            path=os.path.join(image_dir, coco.imgs[i]['file_name']),
            width=coco.imgs[i]["width"],
            height=coco.imgs[i]["height"],
            annotations=coco.loadAnns(coco.getAnnIds(
                imgIds=[i], catIds=class_ids, iscrowd=None)))

自然不会加载任何内容。

有人可以帮我写一个加载器函数,它可以在各种 coco 风格的数据集中使用,不管类号是多少?

这是我的数据集结构,它是 coco 风格的:

components
│
└───train
│   │ 
│   └───annotations
│   │    │ <image_id>_<object_class_name>_<annotation_id>.png
│   │    │ ...
│   │   
│   └───<subset><year>
│   │    │   <image_id>.jpeg
│   │    │   ...  
│   └───  instances_components_train2018.json
└───val
    │ 
    └───annotations
    │    │ <image_id>_<object_class_name>_<annotation_id>.png
    │    │ ...
    │   
    └───<subset><year>
    │    │   <image_id>.jpeg
    │    │   ...
    │    │  
    └───  instances_components_val2018.json

编辑:完整追溯:

---------------------------------------------------------------------------
TypeError                                 Traceback (most recent call last)
<ipython-input-11-5f1fb6581c25> in <module>()
      1 # Load dataset
      2 dataset = components.ComponentsDataset()
----> 3 dataset.load_components(DATASET_DIR, subset="train")
      4 
      5 # Must call before using the dataset

~/workspace/Mask_RCNN/samples/components/components.py in load_components(self, dataset_dir, subset)
     72         # Load all classes or a subset?
     73         class_ids = sorted(coco.getCatIds())
---> 74 
     75         # All images or a subset?
     76         image_ids = list(coco.imgs.keys())

~/workspace/Mask_RCNN/samples/components/components.py in <listcomp>(.0)
     72         # Load all classes or a subset?
     73         class_ids = sorted(coco.getCatIds())
---> 74 
     75         # All images or a subset?
     76         image_ids = list(coco.imgs.keys())

TypeError: list indices must be integers or slices, not str
4

1 回答 1

1

好的,所以我想通了。我在这里找到了一个文件,显示了加载可可样式数据集并使其工作的通用方法。

当然,如果你想这样做,你需要稍微修改变量,因为它最初是为“形状”数据集设计的。因此,您将具有“形状”的所有内容重命名为您的数据集名称。

不要试图改变它们的功能和工作方式。不要尝试将其他内容复制到该代码中,整个结构是一个链式结构,如果您更改函数中的某些内容(就流程而言),您可能无法让代码运行。

于 2018-06-08T12:11:58.587 回答