pinkman123's picture

6 3

pinkman123

pinkmanlove

·

AI & ML interests

GPT!

Recent Activity

upvoted a paper about 1 month ago

GDPO: Group reward-Decoupled Normalization Policy Optimization for Multi-reward RL Optimization

upvoted a paper 3 months ago

ToolOrchestra: Elevating Intelligence via Efficient Model and Tool Orchestration

liked a model 3 months ago

moonshotai/Kimi-K2-Thinking

View all activity

Organizations

None yet

upvoted a paper about 1 month ago

GDPO: Group reward-Decoupled Normalization Policy Optimization for Multi-reward RL Optimization

Paper • 2601.05242 • Published Jan 8 • 226

upvoted a paper 3 months ago

ToolOrchestra: Elevating Intelligence via Efficient Model and Tool Orchestration

Paper • 2511.21689 • Published Nov 26, 2025 • 124

liked a model 3 months ago

moonshotai/Kimi-K2-Thinking

Text Generation • Updated 18 days ago • 325k • • 1.67k

upvoted 2 papers 3 months ago

Paper2Video: Automatic Video Generation from Scientific Papers

Paper • 2510.05096 • Published Oct 6, 2025 • 119

Fast-dLLM v2: Efficient Block-Diffusion LLM

Paper • 2509.26328 • Published Sep 30, 2025 • 58

upvoted a paper 9 months ago

ProRL: Prolonged Reinforcement Learning Expands Reasoning Boundaries in Large Language Models

Paper • 2505.24864 • Published May 30, 2025 • 143

liked 2 datasets 10 months ago

nvidia/Nemotron-ClimbMix

Viewer • Updated Oct 21, 2025 • 355M • 2.57k • 42

nvidia/Nemotron-ClimbLab

Viewer • Updated Apr 21, 2025 • 1.1B • 7.65k • 37

upvoted a paper 10 months ago

CLIMB: CLustering-based Iterative Data Mixture Bootstrapping for Language Model Pre-training

Paper • 2504.13161 • Published Apr 17, 2025 • 93

updated a model almost 3 years ago

pinkmanlove/gpt-7b

Updated Mar 31, 2023