Jay Gala's picture

Jay Gala

jaygala24

·

https://jaygala24.github.io/

AI & ML interests

Machine Learning, Natural Language Processing, Language and Vision Intersection, Fairness and Biases

Recent Activity

updated a collection 2 days ago

RL post-training

updated a model 3 days ago

jaygala24/Qwen3-4B-RLOO-math-reasoning

published a model 3 days ago

jaygala24/Qwen3-4B-RLOO-math-reasoning

View all activity

Organizations

jaygala24 's models 24

jaygala24/Qwen3-4B-RLOO-math-reasoning

Text Generation • 4B • Updated 2 days ago • 174

jaygala24/Qwen3-1.7B-RLOO-math-reasoning

Text Generation • 2B • Updated 3 days ago • 706

jaygala24/Qwen2.5-3B-RLOO-math-reasoning

Text Generation • 3B • Updated 3 days ago • 659

jaygala24/Qwen2.5-1.5B-RLOO-math-reasoning

Text Generation • 2B • Updated 3 days ago • 626

jaygala24/Qwen2.5-0.5B-RLOO-math-reasoning

Text Generation • 0.5B • Updated 3 days ago • 587

jaygala24/Qwen3-1.7B-DAPO-math-reasoning

Text Generation • 2B • Updated 3 days ago • 563

jaygala24/Qwen2.5-3B-DAPO-math-reasoning

Text Generation • 3B • Updated 3 days ago • 569

jaygala24/Qwen2.5-1.5B-DAPO-math-reasoning

Text Generation • 2B • Updated 3 days ago • 561

jaygala24/Qwen2.5-0.5B-DAPO-math-reasoning

Text Generation • 0.5B • Updated 3 days ago • 577

jaygala24/Qwen3-4B-ReMax-math-reasoning

Text Generation • 4B • Updated 9 days ago • 805

jaygala24/Qwen3-4B-GRPO-math-reasoning

Text Generation • 4B • Updated 9 days ago • 862

jaygala24/Qwen3-4B-GRPO-KL-math-reasoning

Text Generation • 4B • Updated 9 days ago • 1.04k

jaygala24/Qwen3-1.7B-ReMax-math-reasoning

Text Generation • 2B • Updated 9 days ago • 865

jaygala24/Qwen3-1.7B-GRPO-math-reasoning

Text Generation • 2B • Updated 9 days ago • 821

jaygala24/Qwen3-1.7B-GRPO-KL-math-reasoning

Text Generation • 2B • Updated 9 days ago • 812

jaygala24/Qwen2.5-3B-ReMax-math-reasoning

Text Generation • 3B • Updated 9 days ago • 444

jaygala24/Qwen2.5-3B-GRPO-math-reasoning

Text Generation • 3B • Updated 9 days ago • 803

jaygala24/Qwen2.5-3B-GRPO-KL-math-reasoning

Text Generation • 3B • Updated 9 days ago • 778

jaygala24/Qwen2.5-1.5B-ReMax-math-reasoning

Text Generation • 2B • Updated 9 days ago • 438

jaygala24/Qwen2.5-1.5B-GRPO-math-reasoning

Text Generation • 2B • Updated 9 days ago • 567

jaygala24/Qwen2.5-1.5B-GRPO-KL-math-reasoning

Text Generation • 2B • Updated 9 days ago • 524

jaygala24/Qwen2.5-0.5B-ReMax-math-reasoning

Text Generation • 0.5B • Updated 9 days ago • 443

jaygala24/Qwen2.5-0.5B-GRPO-math-reasoning

Text Generation • 0.5B • Updated 9 days ago • 569

jaygala24/Qwen2.5-0.5B-GRPO-KL-math-reasoning

Text Generation • 0.5B • Updated 9 days ago • 536