Mubarak Shah

Video-FocalNets: Spatio-Temporal Focal Modulation for Video Action Recognition

Video-FocalNets: Spatio-Temporal Focal Modulation for Video Action Recognition

**Visual-Spatial and Temporal Perception**, **ICCV 2023** Spatio-temporal focal modulation for video recognition is an efficient network.

Jul 13, 2023

Frequency Domain Adversarial Training for Robust Volumetric Medical Segmentation

Frequency Domain Adversarial Training for Robust Volumetric Medical Segmentation

**MICCAI 2023** Frequency domain adversarial training for robust medical segmentation.

May 25, 2023

Vita-CLIP: Video and text adaptive CLIP via Multimodal Prompting

Vita-CLIP: Video and text adaptive CLIP via Multimodal Prompting

**Vision-Language Model**, **CVPR 2023** Adapting vision language Foundational models like CLIP for video recognition.

Feb 27, 2023