Inference Optimization

community

AI & ML interests

None defined yet.

Recent Activity

nm-research updated a model about 1 hour ago

inference-optimization/Qwen3-8B-speculator.dflash.swa.dpace.fullvocab.adamw.2048anc-qwen235b-instr-bs16-v3-10ep-ckpt7

nm-research updated a model about 1 hour ago

inference-optimization/Qwen3-8B-speculator.dflash.swa.dpace.fullvocab.adamw.2048anchors-qwen235b-instruct-bs16-v3-ckpt7

nm-research published a model about 1 hour ago

inference-optimization/Qwen3-8B-speculator.dflash.swa.dpace.fullvocab.adamw.2048anc-qwen235b-instr-bs16-v3-10ep-ckpt7

View all activity

inference-optimization 's models 270

inference-optimization/Qwen3-8B-speculator.dflash.swa.causal-qwen235b-instruct-bs16-muon-ckpt5

2B • Updated 26 days ago • 129

inference-optimization/Qwen3-8B-speculator.dflash.swa.non-qwen3-step420136

2B • Updated 28 days ago • 99

inference-optimization/Qwen3-8B-speculator.dflash.swa.causal-qwen235b-instruct-bs16-muon-ckpt4

2B • Updated 28 days ago • 62

inference-optimization/Qwen3-8B-FP8-Dynamic

Text Generation • 8B • Updated 28 days ago • 67

inference-optimization/Qwen3-8B-speculator.dflash.fullattn-qwen235b-instruct-bs16-ckpt0

2B • Updated 29 days ago • 143

inference-optimization/dflash-DeepSeek-V4-Flash-swa-muon-speculators-50k

2B • Updated 30 days ago • 43

inference-optimization/dflash-DeepSeek-V4-Flash-all-swa-muon-speculators-50k

2B • Updated 30 days ago • 81 • 2

inference-optimization/Qwen3.5-397B-A17B-FP8-dynamic-data-subset-speculator.dflash

2B • Updated Jun 26 • 39

inference-optimization/Qwen3-8B-from-Qwen3-8B_regen-speculators.eagle31-fcnorm-ckpt1

1B • Updated Jun 26 • 36

inference-optimization/Qwen3-8B-speculator.dflash.swa.causal-qwen235b-instruct-bs16-ckpt4

2B • Updated Jun 24 • 112

inference-optimization/Qwen3-8B-from-Qwen3-8B_regen-speculators.eagle31-qwen3arch-3e4-ckpt1

1B • Updated Jun 24 • 37

inference-optimization/Qwen3-8B-speculator.dflash.swa.causal-qwen235b-instruct-bs16-ckpt3

2B • Updated Jun 23 • 29

inference-optimization/Qwen3-8B-from-Qwen3-8B_regen-speculators.eagle31-qwen3arch-ckpt1

1B • Updated Jun 23 • 28

inference-optimization/Nemotron-3-Super-prepared-data

inference-optimization/Nemotron-Super-120B-Dflash-SWA

1B • Updated Jun 22 • 32

inference-optimization/Qwen3-8B-speculator.dflash.swa.non-qwen3-step210040

2B • Updated Jun 22 • 42

inference-optimization/Qwen3-8B-speculator.dflash.swa.causal-qwen235b-instruct-bs16-ckpt2

2B • Updated Jun 22 • 25

inference-optimization/Phi-3.5-MoE-0.8B-A0.2B

Text Generation • 0.8B • Updated Jun 22 • 37

inference-optimization/Qwen3-8B-from-Qwen3-8B_regen-speculators.eagle31-llamaarch-ckpt1

1B • Updated Jun 21 • 30

inference-optimization/Qwen3-8B-speculator.dflash.swa.non-qwen3-step189036

2B • Updated Jun 19 • 23

inference-optimization/Laguna-XS.2-speculator.dflash-Qwen235B-500k-ckpt5

0.6B • Updated Jun 19 • 25

inference-optimization/Qwen3-8B-speculator.dflash.swa.causal-qwen235b-instruct-bs16-ckpt0

2B • Updated Jun 18 • 21

inference-optimization/Qwen3-8B-speculator.dflash.swa.non-qwen3-step126024

2B • Updated Jun 18 • 21

inference-optimization/Qwen3-8B-speculator.dflash.swa.non-qwen3-step84016

2B • Updated Jun 17 • 9

inference-optimization/Qwen3-8B-speculator.dflash.swa.non-qwen3-step63012

2B • Updated Jun 17 • 4

inference-optimization/Qwen3-8B-speculator.dflash.swa.non-qwen3-step42008

2B • Updated Jun 16 • 5

inference-optimization/Qwen3-8B-speculators.peagle-qwen3arch-ckpt4

2B • Updated Jun 16 • 25.1k

inference-optimization/Qwen3-8B-speculator.dflash.swa.non-qwen3-step21004

2B • Updated Jun 16 • 6

inference-optimization/Laguna-XS.2-speculator.dflash-Qwen235B-500k-ckpt4

0.6B • Updated Jun 15 • 5

inference-optimization/Qwen3-8B-speculator.dflash.swa.non-qwen3-step56712

2B • Updated Jun 12 • 6