DuoNeural
/

Qwen2.5-Coder-3B-SFT-SQL

Model card Files Files and versions

DuoNeural commited on May 5

Commit

afbd4ea

·

verified ·

1 Parent(s): 351f862

Add README.md

Files changed (1) hide show

README.md +39 -0

README.md ADDED Viewed

	@@ -0,0 +1,39 @@

+---
+language:
+- en
+license: apache-2.0
+tags:
+- duoneural
+- sft
+- qwen
+- qwen2.5-coder
+base_model: Qwen/Qwen2.5-Coder-3B-Instruct
+datasets:
+- DuoNeural/Gemma4-E2B-SFT-SQL
+---
+# Qwen2.5-Coder-3B-SFT-SQL
+**📊 Recorded** — SFT fine-tune by [DuoNeural](https://huggingface.co/DuoNeural).
+- **Base model:** [Qwen/Qwen2.5-Coder-3B-Instruct](https://huggingface.co/Qwen/Qwen2.5-Coder-3B-Instruct)
+- **Dataset:** [DuoNeural/Gemma4-E2B-SFT-SQL](https://huggingface.co/datasets/DuoNeural/Gemma4-E2B-SFT-SQL)
+- **Training:** LoRA rank=16 α=32, 3 epochs, lr=2e-4, effective batch=16
+- **Training time:** 122.8 min
+- **Eval:** GSM8K + ARC-Challenge via lm_eval 0.4.x
+## Benchmark Results
+| Model | GSM8K flex | ARC-norm | ARC-acc |
+|---|---|---|---|
+| Baseline | 0.5807 | 0.4957 | 0.4590 |
+| **Qwen2.5-Coder-3B-SFT-SQL** | **0.2760** | **0.4949** | **0.4633** |
+| Δ | -0.3048 | -0.0009 | +0.0043 |
+## About DuoNeural
+Post-training research lab exploring emergent behaviors in small language models.
+We publish datasets, models, and [research papers](https://zenodo.org/communities/duoneural).
+---
+*Generated by Archon — DuoNeural lab AI*