Edit Models filters

Model Tree

Apps

Docker Model Runner

Inference Providers

OVHcloud AI Endpoints

HF Inference API

Misc

Inference Endpoints

text-generation-inference

Eval Results (legacy)

text-embeddings-inference

4-bit precision

8-bit precision

Mixture of Experts

Carbon Emissions

Models

704

Base only

Active filters: modelopt

nvidia/GLM-5.2-NVFP4

Text Generation • 381B • Updated 2 days ago • 45.8k • 147

nvidia/Qwen3.6-35B-A3B-NVFP4

Text Generation • 19B • Updated 16 days ago • 5.24M • 369

nvidia/MiniMax-M3-NVFP4

Text Generation • 247B • Updated 2 days ago • 24.8k • 32

nvidia/Gemma-4-26B-A4B-NVFP4

Text Generation • 14B • Updated May 11 • 2.09M • 102

nvidia/NVIDIA-Nemotron-3-Ultra-550B-A55B-NVFP4

Text Generation • 335B • Updated 4 days ago • 423k • • 221

0xSero/GLM-5.2-504B

Text Generation • 290B • Updated 3 days ago • 10.7k • 19

OpenYourMind/GLM-5.2-abliterated

432B • Updated about 22 hours ago • 12

lukealonso/GLM-5.2-NVFP4

Text Generation • 432B • Updated 11 days ago • 67.4k • 27

madeby561/GLM-5.2-NVFP4-REAP-504B-term

Text Generation • 290B • Updated 6 days ago • 1.3k • 13

0xSero/GLM-5.2-504B-Nvidia

Text Generation • 293B • Updated 2 days ago • 31 • 9

DJLougen/Qwable-5-27B-Coder-NVFP4

Text Generation • 15B • Updated 5 days ago • 619 • 9

nvidia/diffusiongemma-26B-A4B-it-NVFP4

Text Generation • 14B • Updated 18 days ago • 1.03M • 87

brandonmusic/GLM-5.2-NVFP4-REAP-Recall-N172

Text Generation • 296B • Updated 1 day ago • 1.32k • 5

nvidia/NVIDIA-Nemotron-3-Super-120B-A12B-NVFP4

Text Generation • 67B • Updated May 1 • 1.13M • 366

AEON-7/Qwen3.6-27B-AEON-Ultimate-Uncensored-Multimodal-NVFP4-MTP-XS

Text Generation • 17B • Updated about 10 hours ago • 31.5k • 51

stepfun-ai/Step-3.7-Flash-NVFP4

Image-Text-to-Text • 104B • Updated 27 days ago • 299k • 55

nvidia/Nemotron-3-Nano-Omni-30B-A3B-Reasoning-FP8

Any-to-Any • 33B • Updated May 5 • 59.8k • 57

nvidia/Kimi-K2.6-NVFP4

Text Generation • Updated May 15 • 673k • 39

nvidia/Qwen3.5-122B-A10B-NVFP4

Text Generation • 65B • Updated 26 days ago • 46.5k • 25

madeby561/GLM-5.2-NVFP4-REAP-504B

Text Generation • 290B • Updated 7 days ago • 418 • 8

Luni/Ornith-1.0-9B-NVFP4-AWQ

Text Generation • 6B • Updated 3 days ago • 293 • 3

nvidia/Qwen3-VL-235B-A22B-Instruct-NVFP4

119B • Updated Mar 4 • 2.43k • 5

nvidia/NVIDIA-Nemotron-3-Super-120B-A12B-FP8

Text Generation • 124B • Updated Apr 29 • 350k • 262

nvidia/MiniMax-M2.7-NVFP4

Text Generation • 116B • Updated Apr 24 • 238k • 61

nvidia/Nemotron-3-Nano-Omni-30B-A3B-Reasoning-NVFP4

Any-to-Any • 18B • Updated May 5 • 1.89M • 145

sakamakismile/Huihui-Qwen3.6-27B-abliterated-NVFP4-MTP

Text Generation • 17B • Updated 28 days ago • 56.5k • 63

AEON-7/Qwen3.6-27B-AEON-Ultimate-Uncensored-Multimodal-NVFP4-MTP

Text Generation • 20B • Updated about 10 hours ago • 36.5k • 21

lukealonso/MiMo-V2.5-NVFP4

179B • Updated May 11 • 18.9k • 21

llmfan46/Qwen3.6-27B-uncensored-heretic-v2-Native-MTP-Preserved-NVFP4-GGUF

Image-Text-to-Text • 27B • Updated May 7 • 15.4k • 29

nvidia/GLM-5.1-NVFP4

Text Generation • 382B • Updated May 27 • 118k • 39