murataksit34 commited on
Commit
d0de1d2
·
verified ·
1 Parent(s): 679dce4

Fix README with correct datasets/splits and curriculum notes

Browse files
Files changed (1) hide show
  1. README.md +9 -9
README.md CHANGED
@@ -15,17 +15,17 @@ datasets:
15
  - murataksit34/veri-bilimci-diyalog-8k-tr
16
  ---
17
 
18
- # Qwen2.5-Coder-3B-DataScience-TR Türkçe Kodlu Analiz Asistanı
19
 
20
- ## Eğitim Kurgusu
21
- 1. Türkçe düşünme adaptasyonu: üzerinde yaklaşık ön eğitim/adaptasyon ( kayıt).
22
- 2. Uzmanlık SFT: .
23
 
24
- ## Kullanılan Dataset Özeti
25
- - Toplam kayıt:
26
- - Split: ·
27
- - assistant_first_unique_ratio:
28
- - assistant_final_unique_ratio:
29
 
30
  ## Copyright
31
  Copyright (c) Zero9 Tech
 
15
  - murataksit34/veri-bilimci-diyalog-8k-tr
16
  ---
17
 
18
+ # Qwen2.5-Coder-3B-DataScience-TR - Turkce Kodlu Analiz Asistani
19
 
20
+ ## Egitim Kurgusu
21
+ 1. Turkce dusunme adaptasyonu: wikimedia/wikipedia uzerinde yaklasik %10 on egitim/adaptasyon (48,148 kayit).
22
+ 2. Uzmanlik SFT: murataksit34/veri-bilimci-diyalog-8k-tr.
23
 
24
+ ## Kullanilan Dataset Ozeti
25
+ - Toplam kayit: 7,656
26
+ - Split: train 6,124 ; test 1,532
27
+ - assistant_first_unique_ratio: 0.7034
28
+ - assistant_final_unique_ratio: 0.8723
29
 
30
  ## Copyright
31
  Copyright (c) Zero9 Tech