Pratyay Banerjee's picture

In a Training Loop 🔄

Pratyay Banerjee

Neilblaze

·

https://neilblaze.live

AI & ML interests

HCI, Computer Vision, Object Detection, Pattern Recognition, NLP, Supervised Learning

Recent Activity

liked a model 3 days ago

Jiunsong/supergemma4-26b-uncensored-gguf-v2

liked a model 3 days ago

Jiunsong/supergemma4-26b-abliterated-multimodal-mlx-4bit

upvoted a paper 4 days ago

MISA: Mixture of Indexer Sparse Attention for Long-Context LLM Inference

View all activity

Organizations

liked 2 models 3 days ago

Jiunsong/supergemma4-26b-uncensored-gguf-v2

Text Generation • 25B • Updated Apr 12 • 280k • 594

Jiunsong/supergemma4-26b-abliterated-multimodal-mlx-4bit

Image-Text-to-Text • 5B • Updated 28 days ago • 7.93k • 52

upvoted 10 papers 4 days ago

MISA: Mixture of Indexer Sparse Attention for Long-Context LLM Inference

Paper • 2605.07363 • Published 8 days ago • 12

Can RL Teach Long-Horizon Reasoning to LLMs? Expressiveness Is Key

Paper • 2605.06638 • Published 9 days ago • 14

AcademiClaw: When Students Set Challenges for AI Agents

Paper • 2605.02661 • Published 12 days ago • 16

D-OPSD: On-Policy Self-Distillation for Continuously Tuning Step-Distilled Diffusion Models

Paper • 2605.05204 • Published 10 days ago • 25

SkillOS: Learning Skill Curation for Self-Evolving Agents

Paper • 2605.06614 • Published 9 days ago • 42

LLMs Improving LLMs: Agentic Discovery for Test-Time Scaling

Paper • 2605.08083 • Published 8 days ago • 64

Skill1: Unified Evolution of Skill-Augmented Agents via Reinforcement Learning

Paper • 2605.06130 • Published 9 days ago • 106

Flow-OPD: On-Policy Distillation for Flow Matching Models

Paper • 2605.08063 • Published 8 days ago • 93

ARIS: Autonomous Research via Adversarial Multi-Agent Collaboration

Paper • 2605.03042 • Published 12 days ago • 114

Heterogeneous Scientific Foundation Model Collaboration

Paper • 2604.27351 • Published 16 days ago • 213

liked 2 models 7 days ago

ibm-granite/granite-speech-4.1-2b

Automatic Speech Recognition • 2B • Updated 16 days ago • 194k • 93

google/gemma-4-26B-A4B-it-assistant

Any-to-Any • 0.4B • Updated 5 days ago • 75.8k • 125

liked 4 models 9 days ago

unsloth/gemma-4-E4B-it-GGUF

Image-Text-to-Text • 8B • Updated 11 days ago • 1.24M • 410

bartowski/google_gemma-4-E4B-it-GGUF

Image-Text-to-Text • 8B • Updated 12 days ago • 123k • 55

bartowski/google_gemma-4-26B-A4B-it-GGUF

Image-Text-to-Text • 25B • Updated 12 days ago • 185k • 125

bartowski/google_gemma-4-31B-it-GGUF

Image-Text-to-Text • 31B • Updated 12 days ago • 154k • 72

liked a Space 10 days ago

The ultimate guide to RL environments: building and scaling them in the LLM era

Building and scaling RL environments for LLM training

liked a model 10 days ago

XiaomiMiMo/MiMo-V2.5

311B • Updated 7 days ago • 111k • 236