Red Hat AI

company

Verified

https://www.redhat.com/en/products/ai

AI & ML interests

OpenSource and AI

Recent Activity

dsikka updated a model about 7 hours ago

RedHatAI/DeepSeek-V4-Flash-NVFP4-FP8-BLOCK

dsikka new activity about 7 hours ago

RedHatAI/gemma-4-26B-A4B-it-FP8-Dynamic:Update chat_template.jinja

dsikka new activity about 7 hours ago

RedHatAI/gemma-4-26B-A4B-it-NVFP4:Update chat_template.jinja

View all activity

Papers

S2D2: Fast Decoding for Diffusion LLMs via Training-Free Self-Speculation

View all Papers

RedHatAI 's models 658

RedHatAI/pixtral-12b-quantized.w8a8

Image-Text-to-Text • 13B • Updated Feb 25, 2025 • 17 • 1

RedHatAI/granite-3.1-8b-base-FP8-dynamic

Text Generation • 8B • Updated Feb 20, 2025 • 19

RedHatAI/Meta-Llama-3.1-70B-Instruct-quantized.w4a16

Text Generation • 71B • Updated Feb 12, 2025 • 145k • 32

RedHatAI/Meta-Llama-3.1-70B-Instruct-quantized.w8a8

Text Generation • 71B • Updated Feb 11, 2025 • 7.74k • 21

RedHatAI/Phi-3-vision-128k-instruct-W4A16-G128

Text Generation • 1B • Updated Feb 10, 2025 • 23 • 1

RedHatAI/DeepSeek-R1-Llama-70B-quantized.w8a8

71B • Updated Feb 7, 2025 • 6 • 1

RedHatAI/pixtral-12b-FP8-dynamic

Text Generation • 13B • Updated Feb 7, 2025 • 7.73k • 10

RedHatAI/whisper-large-v2-W4A16-G128

Automatic Speech Recognition • 0.3B • Updated Jan 31, 2025 • 25 • 1

RedHatAI/granite-3.1-2b-base-FP8-dynamic

Text Generation • 3B • Updated Jan 30, 2025 • 20

RedHatAI/granite-3.1-2b-instruct-FP8-dynamic

Text Generation • 3B • Updated Jan 28, 2025 • 32

RedHatAI/Llama-3.2-1B-quantized.w8a8

1B • Updated Jan 16, 2025 • 59.1k • 1

RedHatAI/DeepSeek-Coder-V2-Instruct-0724-quantized.w4a16

Text Generation • 238B • Updated Jan 12, 2025 • 145 • 1

RedHatAI/DeepSeek-V2.5-1210-quantized.w4a16

Text Generation • 238B • Updated Jan 11, 2025 • 29

RedHatAI/DeepSeek-V2.5-1210-FP8

Text Generation • 236B • Updated Jan 4, 2025 • 54.7k • 4

RedHatAI/DeepSeek-Coder-V2-Instruct-0724-FP8

Text Generation • 236B • Updated Jan 4, 2025 • 34 • 1

RedHatAI/QwQ-32B-Preview-quantized.w8a8

Text Generation • 33B • Updated Jan 3, 2025 • 12

RedHatAI/QwQ-32B-Preview-FP8-dynamic

Text Generation • 33B • Updated Jan 3, 2025 • 12

RedHatAI/QwQ-32B-Preview-quantized.w4a16

6B • Updated Jan 3, 2025 • 15

RedHatAI/Llama-3.1-Nemotron-70B-Instruct-HF-quantized.w8a8

Text Generation • 71B • Updated Jan 3, 2025 • 8

RedHatAI/Llama-3.1-Nemotron-70B-Instruct-HF-quantized.w4a16

Text Generation • 11B • Updated Jan 3, 2025 • 13

RedHatAI/Mixtral-8x22B-v0.1-quantized.w4a16

18B • Updated Jan 3, 2025 • 17

RedHatAI/Sparse-Llama-3.1-8B-ultrachat_200k-2of4-FP8-dynamic

Text Generation • 8B • Updated Dec 19, 2024 • 3 • 1

RedHatAI/Sparse-Llama-3.1-8B-evolcodealpaca-2of4-FP8-dynamic

Text Generation • 8B • Updated Dec 19, 2024 • 7

RedHatAI/Sparse-Llama-3.1-8B-gsm8k-2of4-FP8-dynamic

Text Generation • 8B • Updated Dec 19, 2024 • 3 • 2

RedHatAI/Sparse-Llama-3.1-8B-gsm8k-2of4-quantized.w4a16

Text Generation • 2B • Updated Dec 19, 2024 • 23

RedHatAI/Sparse-Llama-3.1-8B-ultrachat_200k-2of4-quantized.w4a16

Text Generation • 2B • Updated Dec 19, 2024 • 13 • 3

RedHatAI/Sparse-Llama-3.1-8B-evolcodealpaca-2of4-quantized.w4a16

Text Generation • 2B • Updated Dec 19, 2024 • 7

RedHatAI/Qwen2.5-3B-quantized.w4a16

Text Generation • 1.0B • Updated Dec 17, 2024 • 83

RedHatAI/Qwen2.5-1.5B-quantized.w4a16

Text Generation • 0.6B • Updated Dec 17, 2024 • 263

RedHatAI/Qwen2.5-0.5B-quantized.w4a16

Text Generation • 0.3B • Updated Dec 17, 2024 • 311