Inference Optimization

community

AI & ML interests

None defined yet.

Recent Activity

nm-research updated a model about 12 hours ago

inference-optimization/gpt-oss-120b-ckpt4-speculator.eagle3

nm-research updated a model about 12 hours ago

inference-optimization/gpt-oss-120b-ckpt3-speculator.eagle3

ChibuUkachi updated a model about 12 hours ago

inference-optimization/Qwen3-Coder-Next.w4a16

View all activity

inference-optimization 's models 167

inference-optimization/gpt-oss-120b-ckpt4-speculator.eagle3

0.9B • Updated about 12 hours ago • 15

inference-optimization/gpt-oss-120b-ckpt3-speculator.eagle3

0.9B • Updated about 12 hours ago • 7

inference-optimization/Qwen3-Coder-Next.w4a16

Text Generation • 12B • Updated about 12 hours ago • 1.54k

inference-optimization/Qwen3-32B-Thinking-speculator.eagle3

Text Generation • 2B • Updated about 12 hours ago • 4

inference-optimization/DeepSeek-R1-NVFP4-FP8-BLOCK

397B • Updated about 13 hours ago

inference-optimization/Llama-3.2-3B-Instruct_7_bits_mode_heuristic

3B • Updated about 14 hours ago

inference-optimization/Llama-3.2-3B-Instruct_7_bits_mode_noise

3B • Updated about 14 hours ago

inference-optimization/Llama-3.2-3B-Instruct_7_bits_mode_hybrid

3B • Updated about 14 hours ago

inference-optimization/Llama-3.2-3B-Instruct_6.5_bits_mode_heuristic

3B • Updated about 14 hours ago

inference-optimization/Llama-3.2-3B-Instruct_6.5_bits_mode_noise

3B • Updated about 14 hours ago

inference-optimization/Llama-3.2-3B-Instruct_6.5_bits_mode_hybrid

3B • Updated about 14 hours ago

inference-optimization/Llama-3.2-3B-Instruct_6_bits_mode_heuristic

3B • Updated about 14 hours ago

inference-optimization/Llama-3.2-3B-Instruct_6_bits_mode_noise

3B • Updated about 14 hours ago

inference-optimization/Llama-3.2-3B-Instruct_6_bits_mode_hybrid

3B • Updated about 14 hours ago

inference-optimization/Llama-3.2-3B-Instruct_5.5_bits_mode_heuristic

3B • Updated about 14 hours ago

inference-optimization/Llama-3.2-3B-Instruct_5.5_bits_mode_noise

3B • Updated about 14 hours ago

inference-optimization/Llama-3.2-3B-Instruct_5.5_bits_mode_hybrid

3B • Updated about 14 hours ago

inference-optimization/Llama-3.2-3B-Instruct_5_bits_mode_heuristic

3B • Updated about 14 hours ago

inference-optimization/Llama-3.2-3B-Instruct_5_bits_mode_noise

3B • Updated about 14 hours ago

inference-optimization/Llama-3.2-3B-Instruct_5_bits_mode_hybrid

3B • Updated about 14 hours ago

inference-optimization/Llama-3.2-1B-Instruct_7_bits_mode_noise

1B • Updated about 14 hours ago

inference-optimization/Llama-3.2-1B-Instruct_6.5_bits_mode_noise

1B • Updated about 14 hours ago

inference-optimization/Llama-3.2-1B-Instruct_6.5_bits_mode_hybrid

1B • Updated about 14 hours ago

inference-optimization/Llama-3.2-1B-Instruct_6_bits_mode_noise

1B • Updated about 14 hours ago

inference-optimization/Llama-3.2-1B-Instruct_6_bits_mode_hybrid

1B • Updated about 14 hours ago

inference-optimization/Llama-3.2-1B-Instruct_5.5_bits_mode_heuristic

1B • Updated about 14 hours ago

inference-optimization/Llama-3.2-1B-Instruct_5.5_bits_mode_noise

1B • Updated about 14 hours ago

inference-optimization/Llama-3.2-1B-Instruct_5.5_bits_mode_hybrid

1B • Updated about 14 hours ago

inference-optimization/Llama-3.2-1B-Instruct_5_bits_mode_heuristic

1B • Updated about 14 hours ago

inference-optimization/Llama-3.2-1B-Instruct_5_bits_mode_noise

1B • Updated about 14 hours ago