评测数据 (视频分类)
Kinetics-400
数据描述:
Kinetics-400是一个大规模视频动作识别数据集,由DeepMind团队于2017年发布。它是为训练和评估视频动作识别模型设计的,目前广泛用于该领域的研究。Kinetics-400显著扩展了视频动作识别数据集的数据规模和多样性,其视频数据来源于YouTube,包含400个不同的动作类别,涵盖了绝大多数人类的日常生活场景。每个视频片段的时长大约为10秒,以确保每个视频主要展示一个特定的动作。该数据集总共包括超过30万个视频样本,其中训练集有近24万个视频,验证集和测试集各2万个视频。由于原测试集标注未公开,将原验证集作为测试集。
数据集构成和规范:
数据量:
源数据集分成训练集(240,435),验证集(19,795),测试集(19,795)
评测数据量:
评测数据为测试集中的19,795个测试样例
数据字段:
KEYS | EXPLAIN |
---|---|
videos | 用于输入的视频 |
labels | 该视频的类别标签 |
数据集样例:
视频:
类别:
brushing hair
论文引用:
@article{kay2017kinetics,
title={The kinetics human action video dataset},
author={Kay, Will and Carreira, Joao and Simonyan, Karen and Zhang, Brian and Hillier, Chloe and Vijayanarasimhan, Sudheendra and Viola, Fabio and Green, Tim and Back, Trevor and Natsev, Paul and others},
journal={arXiv preprint arXiv:1705.06950},
year={2017}
}