Yang

joyfine

AI & ML interests

None yet

Recent Activity

upvoted a paper 1 day ago

Self-Improvement of Large Language Models: A Technical Overview and Future Outlook

upvoted a paper 1 day ago

Capability Self-Assessment: Teaching LLMs to Know Their Limits

updated a dataset about 1 month ago

joyfine/router_SFT_larger_model_generated_data_mmlu_pro_science_Qwen3-4B_aime

View all activity

Organizations

None yet

upvoted 2 papers 1 day ago

Self-Improvement of Large Language Models: A Technical Overview and Future Outlook

Paper • 2603.25681 • Published Mar 26 • 1

Capability Self-Assessment: Teaching LLMs to Know Their Limits

Paper • 2606.00251 • Published 5 days ago • 9

updated a dataset about 1 month ago

joyfine/router_SFT_larger_model_generated_data_mmlu_pro_science_Qwen3-4B_aime

Viewer • Updated Apr 30 • 860 • 37

published a dataset about 1 month ago

joyfine/router_SFT_larger_model_generated_data_mmlu_pro_science_Qwen3-4B_aime

Viewer • Updated Apr 30 • 860 • 37

updated a dataset about 1 month ago

joyfine/router_SFT_self_generated_data_mmlu_pro_science_Qwen3-4B_aime

Viewer • Updated Apr 30 • 860 • 34

published a dataset about 1 month ago

joyfine/router_SFT_self_generated_data_mmlu_pro_science_Qwen3-4B_aime

Viewer • Updated Apr 30 • 860 • 34

updated a dataset about 1 month ago

joyfine/router_PEFT_data_Math_5_shot_Qwen3-4B_aime

Viewer • Updated Apr 30 • 860 • 26

published a dataset about 1 month ago

joyfine/router_PEFT_data_Math_5_shot_Qwen3-4B_aime

Viewer • Updated Apr 30 • 860 • 26

updated a dataset about 1 month ago

joyfine/router_PEFT_data_Math_5_shot_Qwen3-4B_gsm8k

Viewer • Updated Apr 29 • 1k • 47

published a dataset about 1 month ago

joyfine/router_PEFT_data_Math_5_shot_Qwen3-4B_gsm8k

Viewer • Updated Apr 29 • 1k • 47

updated a dataset about 1 month ago

joyfine/router_PEFT_data_mmlu_pro_science_5_shot_shuffle_OLMo-2-1124-13B-Instruct

Viewer • Updated Apr 24 • 3.27k • 14

published a dataset about 1 month ago

joyfine/router_PEFT_data_mmlu_pro_science_5_shot_shuffle_OLMo-2-1124-13B-Instruct

Viewer • Updated Apr 24 • 3.27k • 14

updated a model about 1 month ago

joyfine/Qwen3-14B-Science

425k • Updated Apr 23 • 3

published a model about 1 month ago

joyfine/Qwen3-14B-Science

425k • Updated Apr 23 • 3

updated a dataset about 2 months ago

joyfine/router_PEFT_data_Math_5_shot_Meta-Llama-3-8B-Instruct

Viewer • Updated Apr 14 • 2.26k • 10

published a dataset about 2 months ago

joyfine/router_PEFT_data_Math_5_shot_Meta-Llama-3-8B-Instruct

Viewer • Updated Apr 14 • 2.26k • 10

updated a dataset about 2 months ago

joyfine/router_PEFT_data_mmlu_pro_science_5_shot_shuffle_Meta-Llama-3-8B-Instruct

Viewer • Updated Apr 14 • 3.27k • 23

published a dataset about 2 months ago

joyfine/router_PEFT_data_mmlu_pro_science_5_shot_shuffle_Meta-Llama-3-8B-Instruct

Viewer • Updated Apr 14 • 3.27k • 23

updated a dataset about 2 months ago

joyfine/router_SFT_self_generated_data_mmlu_pro_science_Meta-Llama-3-8B-Instruct

Viewer • Updated Apr 14 • 3.27k • 429

published a dataset about 2 months ago

joyfine/router_SFT_self_generated_data_mmlu_pro_science_Meta-Llama-3-8B-Instruct

Viewer • Updated Apr 14 • 3.27k • 429

Yang

AI & ML interests

Recent Activity

Organizations

joyfine's activity