数据模块
本节相关代码:
core/data/augments.py
core/data/dataloader.py
core/data/dataset.py
数据集格式
在LibContinual中,所用的数据集有固定的格式。我们按照大多数持续学习设置下的数据集格式进行数据的读取,例如 CIFAR-10 和 CIFAR-100 ,因此只需从网络上下载数据集并解压就可以使用。如果你想要使用一个新的数据集,并且该数据集的数据形式与以上数据集不同,那么你需要自己动手将其转换成相同的格式。
与 CIFAR-10 一样,数据集的格式应该和下面的示例一样:
dataset_folder/
├── train/
│ ├── class_1/
│ ├── image_1.png
│ ├── ...
│ └── image_5000.png
│ ├── ...
│ ├── class_10/
│ ├── image_1.png
│ ├── ...
│ └── image_5000.png
├── test/
│ ├── class_1/
│ ├── image_1.png
│ ├── ...
│ └── image_5000.png
│ ├── ...
│ ├── class_10/
│ ├── image_1.png
│ ├── ...
│ └── image_5000.png
训练图像、测试图像需要分别放置在train和test文件夹下,其中同一类别所有图像放置在与类别同名文件夹中,例如cat、dog等。
配置数据集
当下载好或按照上述格式整理好数据集后,只需要在配置文件中修改data_root字段即可,注意LibeContinual会将数据集文件夹名当作数据集名称打印在log上。