VISIONx @ NYU

university

https://www.sainingxie.com/

AI & ML interests

None defined yet.

Recent Activity

xcpan authored a paper 13 days ago

RepFusion: Leveraging Multimodal Priors for Denoising in Representation Space

sihyun-yu authored a paper 15 days ago

Video Probabilistic Diffusion Models in Projected Latent Space

sihyun-yu authored a paper 15 days ago

Controllable Human Image Generation with Personalized Multi-Garments

View all activity

Papers

Benchmarking Visual State Tracking in Multimodal Video Understanding

PaintBench: Deterministic Evaluation of Precise Visual Editing

View all Papers

nyu-visionx 's models 53

nyu-visionx/Cambrian-P-7B-Mix-CamS

8B • Updated May 21 • 5

nyu-visionx/Cambrian-P-7B-Mix-3R

8B • Updated May 21 • 6

nyu-visionx/Cambrian-P-7B-Mix-MA

8B • Updated May 21 • 7

nyu-visionx/Cambrian-P-7B-32f

8B • Updated May 21 • 5

nyu-visionx/Cambrian-P-7B

8B • Updated May 21 • 28 • 1

nyu-visionx/RAEv2-models

Updated May 18 • 4

nyu-visionx/Scale-RAE-Qwen1.5B_DiT2.4B-64ep

Text Generation • 4B • Updated Mar 15 • 13

nyu-visionx/Scale-RAE-Qwen7B_DiT9.8B-64ep

Text Generation • 17B • Updated Mar 15 • 6

nyu-visionx/solaris

Updated Mar 4 • 11

nyu-visionx/RAE-mae-base-p16-ViTXL-n08

Updated Mar 3 • 29

nyu-visionx/RAE-siglip2-base-p16-i256-ViTXL-n08

Updated Mar 3 • 22

nyu-visionx/RAE-dinov2-wReg-large-ViTXL-n08

Updated Mar 3 • 44 • 1

nyu-visionx/RAE-dinov2-wReg-small-ViTXL-n08

Updated Mar 3 • 32

nyu-visionx/RAE-dinov2-wReg-base-ViTXL-n08-i512

Updated Mar 3 • 25

nyu-visionx/RAE-dinov2-wReg-base-ViTXL-n08

Updated Mar 3 • 62

nyu-visionx/RAE-collections

Unconditional Image Generation • Updated Mar 1 • 47

nyu-visionx/dinov2-large_decoder

Updated Feb 7 • 6

nyu-visionx/webmae_decoder

Updated Jan 30 • 5

nyu-visionx/siglip2_decoder

Image-to-Image • Updated Jan 24 • 3.73k

nyu-visionx/webssl300m_decoder

Image-to-Image • Updated Jan 24 • 1.09k

nyu-visionx/Scale-RAE-Qwen1.5B_DiT2.4B-WebSSL

Text-to-Image • 4B • Updated Jan 24 • 2.19k

nyu-visionx/Scale-RAE-Qwen7B_DiT9.8B

Text Generation • 17B • Updated Jan 8 • 138 • 1

nyu-visionx/Scale-RAE-Qwen1.5B_DiT2.4B

Text Generation • 4B • Updated Jan 8 • 8.48k

nyu-visionx/Cambrian-S-3B-S3

3B • Updated Jan 4 • 2

nyu-visionx/Cambrian-S-3B-S2

3B • Updated Jan 4 • 1

nyu-visionx/Cambrian-S-3B-S1

3B • Updated Jan 4 • 2

nyu-visionx/Cambrian-S-1.5B-S3

2B • Updated Jan 4 • 2

nyu-visionx/Cambrian-S-1.5B-S2

2B • Updated Jan 4 • 4

nyu-visionx/Cambrian-S-1.5B-S1

2B • Updated Jan 4 • 2

nyu-visionx/Cambrian-S-0.5B-S3

0.9B • Updated Jan 4 • 3