评测数据 (小样本图像分类)
ImageNet-1K
数据描述:
ImageNet-1K数据集是ImageNet数据集的一个子集,它被用于ILSVRC2012,拥有1,000个分类,训练集的图片总数约为120万张,验证集的图片总数为5万张。从原训练集中每类采样15张图像构成训练集,每类采样15张图像构成验证集,原验证集作为测试集。
数据集构成和规范:
源数据量:
数据集分成辅助训练集(15,000),验证集(15,000),测试集(50,000)
评测数据量:
测试集中的全部50,000个测试样例
数据字段:
KEYS | EXPLAIN |
---|---|
images | 用于输入的RGB图像 |
labels | 该图像的类别标签 |
源数据集样例:
RGB图像:
类别标签:
n01440764
论文引用:
@inproceedings{deng2009imagenet,
title={Imagenet: A large-scale hierarchical image database},
author={Deng, Jia and Dong, Wei and Socher, Richard and Li, Li-Jia and Li, Kai and Fei-Fei, Li},
booktitle={Computer Vision and Pattern Recognition},
pages={248--255},
year={2009},
organization={IEEE}
}
Place365-Standard
数据描述:
Places365-Standard数据集是一个场景识别数据集,具有1,800,000张来自K=365个场景类的训练图像和36,500张验证图像。从原训练集中每类采样15张图像构成训练集,每类采样15张图像构成验证集,原验证集作为测试集。
数据集构成和规范:
源数据量:
数据集分成辅助训练集(5,475),验证集(5,475),测试集(36,500)
评测数据量:
测试集中的全部36,000个测试样例
数据字段:
KEYS | EXPLAIN |
---|---|
images | 用于输入的RGB图像 |
labels | 该图像的类别标签 |
源数据集样例:
RGB图像:
类别标签:
airfield
论文引用:
@article{zhou2017places,
title={Places: A 10 million image database for scene recognition},
author={Zhou, Bolei and Lapedriza, Agata and Khosla, Aditya and Oliva, Aude and Torralba, Antonio},
journal={IEEE transactions on pattern analysis and machine intelligence},
volume={40},
number={6},
pages={1452--1464},
year={2017},
publisher={IEEE}
}
数据集版权使用说明:
Creative Common License (Attribution CC BY)
Stanford Cars
数据描述:
Stanford Cars数据集包含196类汽车的16,185张图像。数据被划分为8,144个训练图像和8,041个测试图像,其中每个类别大致以50-50的比例划分,评测任务中图像类别为汽车品牌。从原训练集中每类采样15张图像构成训练集,每类采样15张左右图像构成验证集,原验证集作为测试集。
数据集构成和规范:
源数据量:
数据集分成辅助训练集(2,940),验证集(2,931),测试集(8,041)
评测数据量:
测试集中的全部8,041个测试样例
数据字段:
KEYS | EXPLAIN |
---|---|
images | 用于输入的RGB图像 |
labels | 该图像的类别标签 |
源数据集样例:
RGB图像:
类别标签:
Acura Integra Type R 2001
论文引用:
@inproceedings{krause20133d,
title={3d object representations for fine-grained categorization},
author={Krause, Jonathan and Stark, Michael and Deng, Jia and Fei-Fei, Li},
booktitle={Computer Vision Workshops},
pages={554--561},
year={2013}
}
CUB-200-2011
数据描述:
CUB-200-2011数据集是细粒度视觉分类任务中使用最广泛的数据集。它包含11,788张属于鸟类的200个子类别的图像,5,994张用于训练,5,794张用于测试。从原训练集中每类采样15张图像构成训练集,每类采样15张左右图像构成验证集,原验证集作为测试集。
数据集构成和规范:
源数据量:
数据集分成辅助训练集(3,000),验证集(2,994),测试集(5,794)
评测数据量:
测试集中的全部5,794个测试样例
数据字段:
KEYS | EXPLAIN |
---|---|
images | 用于输入的RGB图像 |
labels | 该图像的类别标签 |
源数据集样例:
RGB图像:
类别标签:
Black_Footed_Albatross
论文引用:
@article{wah2011caltech,
title={The caltech-ucsd birds-200-2011 dataset},
author={Wah, Catherine and Branson, Steve and Welinder, Peter and Perona, Pietro and Belongie, Serge},
year={2011},
publisher={California Institute of Technology}
}
FGVC-Aircraft
数据描述:
FGVC-Aircraft数据集包含10,000张飞机图像,100种不同型号,每种型号的飞机都有100张左右图像,其中2/3被划分为训练集,其余1/3作为测试集。从原训练集中每类采样15张图像构成训练集,每类采样15张图像构成验证集,原验证集作为测试集。
数据集构成和规范:
源数据量:
数据集分成辅助训练集(1,500),验证集(1,500),测试集(3,333)
评测数据量:
测试集中的全部3,333个测试样例
数据字段:
KEYS | EXPLAIN |
---|---|
images | 用于输入的RGB图像 |
labels | 该图像的类别标签 |
源数据集样例:
RGB图像:
类别标签:
Boeing
论文引用:
@article{maji2013fine,
title={Fine-grained visual classification of aircraft},
author={Maji, Subhransu and Rahtu, Esa and Kannala, Juho and Blaschko, Matthew and Vedaldi, Andrea},
journal={arXiv preprint arXiv:1306.5151},
year={2013}
}
Food-101
数据描述:
Food-101数据集由101个食物类别组成,每个类别有750个训练图像和250个测试图像,总共有101K个图像。测试图像的标签已被手动清理,而训练集包含一些噪声。从原训练集中每类采样15张图像构成训练集,每类采样15张图像构成验证集,原验证集作为测试集。
数据集构成和规范:
源数据量:
数据集分成辅助训练集(1,515),验证集(1,515),测试集(25,250)
评测数据量:
测试集中的全部25,250个测试样例
数据字段:
KEYS | EXPLAIN |
---|---|
images | 用于输入的RGB图像 |
labels | 该图像的类别标签 |
源数据集样例:
RGB图像:
类别标签:
apple-pie
论文引用:
@inproceedings{bossard2014food,
title={Food-101--mining discriminative components with random forests},
author={Bossard, Lukas and Guillaumin, Matthieu and Van Gool, Luc},
booktitle={European Conference on Computer Vision},
pages={446--461},
year={2014},
organization={Springer}
}
DTD
数据描述:
DTD(Describable Textures Dataset)是一个纹理图像数据,包括5,640张图像,按照人类的感知分为47类,每一类120张图像,其中2/3被划分为训练集,其余1/3作为测试集。从原训练集中每类采样15张图像构成训练集,每类采样15张图像构成验证集,原验证集作为测试集。
数据集构成和规范:
源数据量:
数据集分成辅助训练集(705),验证集(705),测试集(1,880)
评测数据量:
测试集中的全部1,880个测试样例
数据字段:
KEYS | EXPLAIN |
---|---|
images | 用于输入的RGB图像 |
labels | 该图像的类别标签 |
源数据集样例:
RGB图像:
类别标签:
banded
论文引用:
@inproceedings{cimpoi2014describing,
title={Describing textures in the wild},
author={Cimpoi, Mircea and Maji, Subhransu and Kokkinos, Iasonas and Mohamed, Sammy and Vedaldi, Andrea},
booktitle={Computer Vision and Pattern Recognition},
pages={3606--3613},
year={2014}
}