动作分类
Action Classification是计算机视觉领域的一个重要子任务,专注于识别和分类视频中的人类行为动作。该任务旨在通过分析视频序列中的动态特征,准确地将不同类型的动作归类到预定义的类别中,从而实现对人类活动的自动理解。其应用价值广泛,包括但不限于智能监控、人机交互、体育分析等领域,能够显著提升系统的智能化水平和用户体验。
Kinetics-400
MTV-H (WTS 60M)
Kinetics-600
MViT-B-24, 32x3
Charades
TokenLearner
Kinetics-700
MoViNet-A6
Toyota Smarthome dataset
π-ViT
AViD
TokenLearner
Moments in Time
ActivityNet-1.2
W-TALC
Kinetics-700-2020
ALIP-ViT B/32 LAION30M
THUMOS’14
3C-Net
WiGesture
Kinetics-Sounds
MIT
InternVideo2-6B
TTStroke-21 ME22
RGB and PRGB
ActivityNet
UniFormerV2-L
BABEL
2s-AGCN
CelebV-HQ
Diving-48
DualPath w/ ViT-B/16
HMDB51
Jester test
MiniKinetics
MARS+RGB+Flow (16 frames)
Something-Something V2
AdaMAE
THUMOS'14
3C-Net
TTStroke-21 ME21
UCF101
Ours
YouCook2
VideoBERT (cross modal)