LibContinual / docs /tutorials /zh /data_module_zh.md
boringKey's picture
Upload 236 files
5fee096 verified

数据模块

本节相关代码:

core/data/augments.py
core/data/dataloader.py
core/data/dataset.py

数据集格式

LibContinual中,所用的数据集有固定的格式。我们按照大多数持续学习设置下的数据集格式进行数据的读取,例如 CIFAR-10CIFAR-100 ,因此只需从网络上下载数据集并解压就可以使用。如果你想要使用一个新的数据集,并且该数据集的数据形式与以上数据集不同,那么你需要自己动手将其转换成相同的格式。

与 CIFAR-10 一样,数据集的格式应该和下面的示例一样:

dataset_folder/
├── train/
│   ├── class_1/
│      ├── image_1.png
│      ├── ...
│      └── image_5000.png
│   ├── ...
│   ├── class_10/
│      ├── image_1.png
│      ├── ...
│      └── image_5000.png
├── test/
│   ├── class_1/
│      ├── image_1.png
│      ├── ...
│      └── image_5000.png
│   ├── ...
│   ├── class_10/
│      ├── image_1.png
│      ├── ...
│      └── image_5000.png

训练图像、测试图像需要分别放置在traintest文件夹下,其中同一类别所有图像放置在与类别同名文件夹中,例如catdog等。

配置数据集

当下载好或按照上述格式整理好数据集后,只需要在配置文件中修改data_root字段即可,注意LibeContinual会将数据集文件夹名当作数据集名称打印在log上。