GAASH-Lab
/

QTrack

Video-Text-to-Text

multi-object-tracking

video-understanding

vision-language-model

spatiotemporal-reasoning

Model card Files Files and versions

File size: 70 Bytes

5f1d711

{
  "image_seq_length": 256,
  "processor_class": "Gemma3Processor"
}