Jay Gala's picture

Jay Gala

jaygala24

·

https://jaygala24.github.io/

AI & ML interests

Machine Learning, Natural Language Processing, Language and Vision Intersection, Fairness and Biases

Recent Activity

updated a dataset 14 days ago

jaygala24/reasoning-geometry

published a dataset 16 days ago

jaygala24/reasoning-geometry

updated a collection 16 days ago

RL post-training

View all activity

Organizations

jaygala24 's models 25

jaygala24/Qwen3-4B-DAPO-math-reasoning

Text Generation • 4B • Updated 16 days ago • 714

jaygala24/Qwen3-4B-RLOO-math-reasoning

Text Generation • 4B • Updated 19 days ago • 457

jaygala24/Qwen3-1.7B-RLOO-math-reasoning

Text Generation • 2B • Updated 20 days ago • 979

jaygala24/Qwen2.5-3B-RLOO-math-reasoning

Text Generation • 3B • Updated 20 days ago • 913

jaygala24/Qwen2.5-1.5B-RLOO-math-reasoning

Text Generation • 2B • Updated 20 days ago • 865

jaygala24/Qwen2.5-0.5B-RLOO-math-reasoning

Text Generation • 0.5B • Updated 20 days ago • 811

jaygala24/Qwen3-1.7B-DAPO-math-reasoning

Text Generation • 2B • Updated 20 days ago • 861

jaygala24/Qwen2.5-3B-DAPO-math-reasoning

Text Generation • 3B • Updated 20 days ago • 828

jaygala24/Qwen2.5-1.5B-DAPO-math-reasoning

Text Generation • 2B • Updated 20 days ago • 1.02k

jaygala24/Qwen2.5-0.5B-DAPO-math-reasoning

Text Generation • 0.5B • Updated 20 days ago • 796

jaygala24/Qwen3-4B-ReMax-math-reasoning

Text Generation • 4B • Updated 25 days ago • 407

jaygala24/Qwen3-4B-GRPO-math-reasoning

Text Generation • 4B • Updated 25 days ago • 462

jaygala24/Qwen3-4B-GRPO-KL-math-reasoning

Text Generation • 4B • Updated 25 days ago • 545

jaygala24/Qwen3-1.7B-ReMax-math-reasoning

Text Generation • 2B • Updated 25 days ago • 450

jaygala24/Qwen3-1.7B-GRPO-math-reasoning

Text Generation • 2B • Updated 25 days ago • 432

jaygala24/Qwen3-1.7B-GRPO-KL-math-reasoning

Text Generation • 2B • Updated 25 days ago • 415

jaygala24/Qwen2.5-3B-ReMax-math-reasoning

Text Generation • 3B • Updated 25 days ago • 348

jaygala24/Qwen2.5-3B-GRPO-math-reasoning

Text Generation • 3B • Updated 25 days ago • 357

jaygala24/Qwen2.5-3B-GRPO-KL-math-reasoning

Text Generation • 3B • Updated 25 days ago • 366

jaygala24/Qwen2.5-1.5B-ReMax-math-reasoning

Text Generation • 2B • Updated 25 days ago • 345

jaygala24/Qwen2.5-1.5B-GRPO-math-reasoning

Text Generation • 2B • Updated 25 days ago • 370

jaygala24/Qwen2.5-1.5B-GRPO-KL-math-reasoning

Text Generation • 2B • Updated 25 days ago • 359

jaygala24/Qwen2.5-0.5B-ReMax-math-reasoning

Text Generation • 0.5B • Updated 25 days ago • 318

jaygala24/Qwen2.5-0.5B-GRPO-math-reasoning

Text Generation • 0.5B • Updated 25 days ago • 349

jaygala24/Qwen2.5-0.5B-GRPO-KL-math-reasoning

Text Generation • 0.5B • Updated 25 days ago • 335