Skip to content

评测数据 (小样本图像分类)

ImageNet-1K

#评测指标-Acc@1, Acc@5

数据描述:

ImageNet-1K数据集是ImageNet数据集的一个子集,它被用于ILSVRC2012,拥有1,000个分类,训练集的图片总数约为120万张,验证集的图片总数为5万张。从原训练集中每类采样15张图像构成训练集,每类采样15张图像构成验证集,原验证集作为测试集。

数据集构成和规范:

源数据量:

数据集分成辅助训练集(15,000),验证集(15,000),测试集(50,000)

评测数据量:

测试集中的全部50,000个测试样例

数据字段:

KEYSEXPLAIN
images用于输入的RGB图像
labels该图像的类别标签

源数据集样例:

RGB图像:

原图

类别标签:

n01440764

论文引用:

@inproceedings{deng2009imagenet,
  title={Imagenet: A large-scale hierarchical image database},
  author={Deng, Jia and Dong, Wei and Socher, Richard and Li, Li-Jia and Li, Kai and Fei-Fei, Li},
  booktitle={Computer Vision and Pattern Recognition},
  pages={248--255},
  year={2009},
  organization={IEEE}
}

Place365-Standard

#评测指标-Acc@1, Acc@5

数据描述:

Places365-Standard数据集是一个场景识别数据集,具有1,800,000张来自K=365个场景类的训练图像和36,500张验证图像。从原训练集中每类采样15张图像构成训练集,每类采样15张图像构成验证集,原验证集作为测试集。

数据集构成和规范:

源数据量:

数据集分成辅助训练集(5,475),验证集(5,475),测试集(36,500)

评测数据量:

测试集中的全部36,000个测试样例

数据字段:

KEYSEXPLAIN
images用于输入的RGB图像
labels该图像的类别标签

源数据集样例:

RGB图像:

原图

类别标签:

airfield

论文引用:

@article{zhou2017places,
  title={Places: A 10 million image database for scene recognition},
  author={Zhou, Bolei and Lapedriza, Agata and Khosla, Aditya and Oliva, Aude and Torralba, Antonio},
  journal={IEEE transactions on pattern analysis and machine intelligence},
  volume={40},
  number={6},
  pages={1452--1464},
  year={2017},
  publisher={IEEE}
}

数据集版权使用说明:

Creative Common License (Attribution CC BY)


Stanford Cars

#评测指标-Acc@1, Acc@5

数据描述:

Stanford Cars数据集包含196类汽车的16,185张图像。数据被划分为8,144个训练图像和8,041个测试图像,其中每个类别大致以50-50的比例划分,评测任务中图像类别为汽车品牌。从原训练集中每类采样15张图像构成训练集,每类采样15张左右图像构成验证集,原验证集作为测试集。

数据集构成和规范:

源数据量:

数据集分成辅助训练集(2,940),验证集(2,931),测试集(8,041)

评测数据量:

测试集中的全部8,041个测试样例

数据字段:

KEYSEXPLAIN
images用于输入的RGB图像
labels该图像的类别标签

源数据集样例:

RGB图像:

原图

类别标签:

Acura Integra Type R 2001

论文引用:

@inproceedings{krause20133d,
  title={3d object representations for fine-grained categorization},
  author={Krause, Jonathan and Stark, Michael and Deng, Jia and Fei-Fei, Li},
  booktitle={Computer Vision Workshops},
  pages={554--561},
  year={2013}
}

CUB-200-2011

#评测指标-Acc@1, Acc@5

数据描述:

CUB-200-2011数据集是细粒度视觉分类任务中使用最广泛的数据集。它包含11,788张属于鸟类的200个子类别的图像,5,994张用于训练,5,794张用于测试。从原训练集中每类采样15张图像构成训练集,每类采样15张左右图像构成验证集,原验证集作为测试集。

数据集构成和规范:

源数据量:

数据集分成辅助训练集(3,000),验证集(2,994),测试集(5,794)

评测数据量:

测试集中的全部5,794个测试样例

数据字段:

KEYSEXPLAIN
images用于输入的RGB图像
labels该图像的类别标签

源数据集样例:

RGB图像:

原图

类别标签:

Black_Footed_Albatross

论文引用:

@article{wah2011caltech,
  title={The caltech-ucsd birds-200-2011 dataset},
  author={Wah, Catherine and Branson, Steve and Welinder, Peter and Perona, Pietro and Belongie, Serge},
  year={2011},
  publisher={California Institute of Technology}
}

FGVC-Aircraft

#评测指标-Acc@1, Acc@5

数据描述:

FGVC-Aircraft数据集包含10,000张飞机图像,100种不同型号,每种型号的飞机都有100张左右图像,其中2/3被划分为训练集,其余1/3作为测试集。从原训练集中每类采样15张图像构成训练集,每类采样15张图像构成验证集,原验证集作为测试集。

数据集构成和规范:

源数据量:

数据集分成辅助训练集(1,500),验证集(1,500),测试集(3,333)

评测数据量:

测试集中的全部3,333个测试样例

数据字段:

KEYSEXPLAIN
images用于输入的RGB图像
labels该图像的类别标签

源数据集样例:

RGB图像:

原图

类别标签:

Boeing

论文引用:

@article{maji2013fine,
  title={Fine-grained visual classification of aircraft},
  author={Maji, Subhransu and Rahtu, Esa and Kannala, Juho and Blaschko, Matthew and Vedaldi, Andrea},
  journal={arXiv preprint arXiv:1306.5151},
  year={2013}
}

Food-101

#评测指标-Acc@1, Acc@5

数据描述:

Food-101数据集由101个食物类别组成,每个类别有750个训练图像和250个测试图像,总共有101K个图像。测试图像的标签已被手动清理,而训练集包含一些噪声。从原训练集中每类采样15张图像构成训练集,每类采样15张图像构成验证集,原验证集作为测试集。

数据集构成和规范:

源数据量:

数据集分成辅助训练集(1,515),验证集(1,515),测试集(25,250)

评测数据量:

测试集中的全部25,250个测试样例

数据字段:

KEYSEXPLAIN
images用于输入的RGB图像
labels该图像的类别标签

源数据集样例:

RGB图像:

原图

类别标签:

apple-pie

论文引用:

@inproceedings{bossard2014food,
  title={Food-101--mining discriminative components with random forests},
  author={Bossard, Lukas and Guillaumin, Matthieu and Van Gool, Luc},
  booktitle={European Conference on Computer Vision},
  pages={446--461},
  year={2014},
  organization={Springer}
}

DTD

#评测指标-Acc@1, Acc@5

数据描述:

DTD(Describable Textures Dataset)是一个纹理图像数据,包括5,640张图像,按照人类的感知分为47类,每一类120张图像,其中2/3被划分为训练集,其余1/3作为测试集。从原训练集中每类采样15张图像构成训练集,每类采样15张图像构成验证集,原验证集作为测试集。

数据集构成和规范:

源数据量:

数据集分成辅助训练集(705),验证集(705),测试集(1,880)

评测数据量:

测试集中的全部1,880个测试样例

数据字段:

KEYSEXPLAIN
images用于输入的RGB图像
labels该图像的类别标签

源数据集样例:

RGB图像:

原图

类别标签:

banded

论文引用:

@inproceedings{cimpoi2014describing,
  title={Describing textures in the wild},
  author={Cimpoi, Mircea and Maji, Subhransu and Kokkinos, Iasonas and Mohamed, Sammy and Vedaldi, Andrea},
  booktitle={Computer Vision and Pattern Recognition},
  pages={3606--3613},
  year={2014}
}