Qi Yu's picture

Qi Yu

QiLeoYu

·

AI & ML interests

None yet

Recent Activity

upvoted a paper 22 days ago

Code as Agent Harness

upvoted a paper 28 days ago

RubricEM: Meta-RL with Rubric-guided Policy Decomposition beyond Verifiable Rewards

upvoted a paper about 1 month ago

Recursive Multi-Agent Systems

View all activity

Organizations

upvoted a paper 22 days ago

Code as Agent Harness

Paper • 2605.18747 • Published 23 days ago • 215

upvoted a paper 28 days ago

RubricEM: Meta-RL with Rubric-guided Policy Decomposition beyond Verifiable Rewards

Paper • 2605.10899 • Published about 1 month ago • 78

upvoted a paper about 1 month ago

Recursive Multi-Agent Systems

Paper • 2604.25917 • Published Apr 28 • 276

upvoted 3 papers 3 months ago

Video-Based Reward Modeling for Computer-Use Agents

Paper • 2603.10178 • Published Mar 10 • 43

Heterogeneous Agent Collaborative Reinforcement Learning

Paper • 2603.02604 • Published Mar 3 • 198

dLLM: Simple Diffusion Language Modeling

Paper • 2602.22661 • Published Feb 26 • 153

upvoted a paper 4 months ago

Weak-Driven Learning: How Weak Agents make Strong Agents Stronger

Paper • 2602.08222 • Published Feb 9 • 290

upvoted 2 papers 5 months ago

Agentic Reasoning for Large Language Models

Paper • 2601.12538 • Published Jan 18 • 205

Your Group-Relative Advantage Is Biased

Paper • 2601.08521 • Published Jan 13 • 158

upvoted a paper 7 months ago

Latent Collaboration in Multi-Agent Systems

Paper • 2511.20639 • Published Nov 25, 2025 • 127

upvoted a paper 12 months ago

Saffron-1: Towards an Inference Scaling Paradigm for LLM Safety Assurance

Paper • 2506.06444 • Published Jun 6, 2025 • 73