评测数据 (图像检索)
SOP
#评测指标-R@1, R@10, R@100, R@1000
数据描述:
SOP(Stanford Online Products)数据集包含120,053张商品图片,有22,634个类别。5,659个类别(29,722张图像)用于训练,5,659个类别(29,829张图像)用于验证,其他11,316个类别(60,502张图像)用于测试。
数据集构成和规范:
源数据量:
数据集分成辅助训练集(29,722),验证集(29,829),测试集(60,502)
评测数据量:
源数据集测试集中的全部60,502个测试样例
数据字段:
KEYS | EXPLAIN |
---|---|
images | 用于输入的RGB图像 |
labels | 该图像的类别标签 |
源数据集样例:
RGB图像:
类别标签:
bicycle
论文引用:
@inproceedings{oh2016deep,
title={Deep metric learning via lifted structured feature embedding},
author={Oh Song, Hyun and Xiang, Yu and Jegelka, Stefanie and Savarese, Silvio},
booktitle={Computer Vision and Pattern Recognition},
pages={4004--4012},
year={2016}
}
数据集版权使用说明:
iNaturalist 2018
数据描述:
iNaturalist 2018数据集中共有8,142个物种类别,其中训练图像437,513张,验证图像24,426张,测试图像149,394张。Andrew Brown在原数据集基础上进行采样划分,其中5,690个类别(325,846张图像)用于训练,2,452个类别(136,093张图像)用于测试。在Andrew Brown划分的基础上,原训练集中2848个类别用于训练、2842个类别用于验证。原测试集不变。
数据集构成和规范:
源数据量:
数据集分成辅助训练集(165,229),验证集(160,617),测试集(136,093)
评测数据量:
Andrew Brown所划分的测试集中的全部136,093个测试样例
数据字段:
KEYS | EXPLAIN |
---|---|
images | 用于输入的RGB图像 |
labels | 该图像的类别标签 |
源数据集样例:
RGB图像:
类别标签:
2229
论文引用:
@inproceedings{van2018inaturalist,
title={The inaturalist species classification and detection dataset},
author={Van Horn, Grant and Mac Aodha, Oisin and Song, Yang and Cui, Yin and Sun, Chen and Shepard, Alex and Adam, Hartwig and Perona, Pietro and Belongie, Serge},
booktitle={Computer Vision and Pattern Recognition},
pages={8769--8778},
year={2018}
}