| # 数据模块 | |
| ## 本节相关代码: | |
| ``` | |
| core/data/augments.py | |
| core/data/dataloader.py | |
| core/data/dataset.py | |
| ``` | |
| ## 数据集格式 | |
| 在`LibContinual`中,所用的数据集有固定的格式。我们按照大多数持续学习设置下的数据集格式进行数据的读取,例如 [CIFAR-10](https://pytorch.org/vision/stable/datasets.html) 和 [CIFAR-100](https://pytorch.org/vision/stable/datasets.html) ,因此只需从网络上下载数据集并解压就可以使用。如果你想要使用一个新的数据集,并且该数据集的数据形式与以上数据集不同,那么你需要自己动手将其转换成相同的格式。 | |
| 与 CIFAR-10 一样,数据集的格式应该和下面的示例一样: | |
| ``` | |
| dataset_folder/ | |
| ├── train/ | |
| │ ├── class_1/ | |
| │ ├── image_1.png | |
| │ ├── ... | |
| │ └── image_5000.png | |
| │ ├── ... | |
| │ ├── class_10/ | |
| │ ├── image_1.png | |
| │ ├── ... | |
| │ └── image_5000.png | |
| ├── test/ | |
| │ ├── class_1/ | |
| │ ├── image_1.png | |
| │ ├── ... | |
| │ └── image_5000.png | |
| │ ├── ... | |
| │ ├── class_10/ | |
| │ ├── image_1.png | |
| │ ├── ... | |
| │ └── image_5000.png | |
| ``` | |
| 训练图像、测试图像需要分别放置在`train`和`test`文件夹下,其中同一类别所有图像放置在与类别同名文件夹中,例如`cat`、`dog`等。 | |
| ## 配置数据集 | |
| 当下载好或按照上述格式整理好数据集后,只需要在配置文件中修改`data_root`字段即可,注意`LibeContinual`会将数据集文件夹名当作数据集名称打印在log上。 | |