Red Hat AI

company

Verified

https://www.redhat.com/en/products/ai

AI & ML interests

OpenSource and AI

Recent Activity

krishnateja95 updated a model about 6 hours ago

RedHatAI/Inkling-Small-FP8-dynamic

krishnateja95 published a model about 6 hours ago

RedHatAI/Inkling-Small-FP8-dynamic

shanjiaz new activity about 11 hours ago

RedHatAI/GLM-5.2-speculator.dspark:Failed to run on 8xB200 - AssertionError: Tried to load weights of size torch.Size([6144, 30720])to a parameter of size torch.Size([6144, 18432])

View all activity

Papers

SNLP: Layer-Parallel Inference via Structured Newton Corrections

S2D2: Fast Decoding for Diffusion LLMs via Training-Free Self-Speculation

View all Papers

RedHatAI 's models 735

RedHatAI/Voxtral-Small-24B-2507-FP8-dynamic

Automatic Speech Recognition • 24B • Updated Feb 5 • 392 • 2

RedHatAI/Phi-4-reasoning

Text Generation • 15B • Updated Jan 19 • 18

RedHatAI/Foundation-Sec-8B

Text Generation • 8B • Updated Jan 19 • 18

RedHatAI/Qwen3-Next-80B-A3B-Thinking-FP8-dynamic

Text Generation • 80B • Updated Jan 14 • 20

RedHatAI/Qwen3-Next-80B-A3B-Thinking-quantized.w4a16

Text Generation • 12B • Updated Jan 14 • 31

RedHatAI/Qwen3-Next-80B-A3B-Instruct-FP8-dynamic

Text Generation • 80B • Updated Jan 14 • 463 • 1

RedHatAI/Qwen3-Next-80B-A3B-Instruct-FP8-block

Text Generation • 80B • Updated Jan 14 • 17

RedHatAI/Qwen3-Next-80B-A3B-Instruct-FP8

Text Generation • 81B • Updated Jan 9 • 5.91k

RedHatAI/starcoder2-15b-quantized.w8a16

Text Generation • 16B • Updated Jan 6 • 23

RedHatAI/Qwen3-Next-80B-A3B-Thinking-FP8-block

Text Generation • 80B • Updated Jan 5 • 19

RedHatAI/Phi-3-mini-128k-instruct-quantized.w8a8

Text Generation • 4B • Updated Jan 5 • 33

RedHatAI/Qwen3-Next-80B-A3B-Thinking-NVFP4

Text Generation • Updated Jan 5 • 389

RedHatAI/Qwen3-8B-FP8-block

Text Generation • 8B • Updated Dec 31, 2025 • 33

RedHatAI/GLM-4.6-FP8

Text Generation • 358B • Updated Dec 24, 2025 • 23

RedHatAI/Kimi-K2-Thinking

Text Generation • 1.1T • Updated Dec 24, 2025 • 33

RedHatAI/Qwen3-Next-80B-A3B-Instruct-NVFP4

Text Generation • Updated Dec 12, 2025 • 996 • 5

RedHatAI/Qwen3-VL-32B-Instruct-NVFP4

Text Generation • 20B • Updated Dec 10, 2025 • 9.75k • 6

RedHatAI/Qwen3-VL-32B-Instruct-FP8-dynamic

Text Generation • 33B • Updated Dec 10, 2025 • 1.52k • 1

RedHatAI/Qwen3-VL-32B-Instruct-FP8-block

Text Generation • 33B • Updated Dec 10, 2025 • 193

RedHatAI/Llama-4-Maverick-17B-128E-Instruct-NVFP4

Text Generation • 229B • Updated Dec 9, 2025 • 123 • 6

RedHatAI/Qwen3-30B-A3B-NVFP4

Text Generation • 17B • Updated Dec 4, 2025 • 22.1k • 2

RedHatAI/Qwen3-235B-A22B-NVFP4

Text Generation • 136B • Updated Dec 4, 2025 • 605 • 1

RedHatAI/Qwen3-235B-A22B-Instruct-2507-NVFP4

Text Generation • 136B • Updated Dec 4, 2025 • 6.38k • 4

RedHatAI/Mistral-Small-3.2-24B-Instruct-2506-NVFP4

Text Generation • 14B • Updated Dec 4, 2025 • 7.61k • 10

RedHatAI/Llama-3.3-70B-Instruct-NVFP4

Text Generation • 41B • Updated Nov 21, 2025 • 13.8k • 2

RedHatAI/Llama-3.1-70B-Instruct-NVFP4

Text Generation • 41B • Updated Nov 21, 2025 • 2.17k • 1

RedHatAI/Llama-3.1-8B-Instruct-NVFP4

Text Generation • 5B • Updated Nov 21, 2025 • 21k • 2

RedHatAI/Qwen3-32B-NVFP4

Text Generation • 19B • Updated Nov 21, 2025 • 2.04k • 9

RedHatAI/Qwen3-14B-NVFP4

Text Generation • 9B • Updated Nov 21, 2025 • 4.77k • 1

RedHatAI/Qwen3-8B-NVFP4

Text Generation • 5B • Updated Nov 21, 2025 • 6.13k • 2