14 24 6

Gaotang Li

gaotang

https://gaotangli.github.io/

GaotangLi

AI & ML interests

None yet

Recent Activity

updated a dataset 3 days ago

gaotang/knowledge_memorization_openbookqa

published a dataset 3 days ago

gaotang/knowledge_memorization_openbookqa

updated a dataset 3 days ago

gaotang/mix_magpie_evol_instruct_140k

View all activity

Organizations

None yet

updated a dataset 3 days ago

gaotang/knowledge_memorization_openbookqa

Updated 3 days ago • 28

published a dataset 3 days ago

gaotang/knowledge_memorization_openbookqa

Updated 3 days ago • 28

updated a dataset 3 days ago

gaotang/mix_magpie_evol_instruct_140k

Viewer • Updated 3 days ago • 140k • 30

published a dataset 3 days ago

gaotang/mix_magpie_evol_instruct_140k

Viewer • Updated 3 days ago • 140k • 30

updated a collection 3 days ago

Beyond-Log-Likelihood

Collection

6 items • Updated 3 days ago • 2

updated a dataset 3 days ago

gaotang/coder_sft

Viewer • Updated 3 days ago • 75.5k • 27

published a dataset 3 days ago

gaotang/coder_sft

Viewer • Updated 3 days ago • 75.5k • 27

updated a dataset 3 days ago

gaotang/low_resource_language

Updated 3 days ago • 28

published a dataset 3 days ago

gaotang/low_resource_language

Updated 3 days ago • 28

commented a paper 8 days ago

RubricEM: Meta-RL with Rubric-guided Policy Decomposition beyond Verifiable Rewards

Paper • 2605.10899 • Published 20 days ago • 76 •

upvoted a paper 12 days ago

Code as Agent Harness

Paper • 2605.18747 • Published 13 days ago • 210

authored a paper 17 days ago

RubricEM: Meta-RL with Rubric-guided Policy Decomposition beyond Verifiable Rewards

Paper • 2605.10899 • Published 20 days ago • 76

upvoted a paper 17 days ago

Useful Memories Become Faulty When Continuously Updated by LLMs

Paper • 2605.12978 • Published 18 days ago • 18

upvoted 2 papers 18 days ago

Beyond Semantic Similarity: Rethinking Retrieval for Agentic Search via Direct Corpus Interaction

Paper • 2605.05242 • Published 28 days ago • 117

RubricEM: Meta-RL with Rubric-guided Policy Decomposition beyond Verifiable Rewards

Paper • 2605.10899 • Published 20 days ago • 76

submitted a paper to Daily Papers 18 days ago

RubricEM: Meta-RL with Rubric-guided Policy Decomposition beyond Verifiable Rewards

Paper • 2605.10899 • Published 20 days ago • 76

upvoted 2 papers about 1 month ago

Heterogeneous Scientific Foundation Model Collaboration

Paper • 2604.27351 • Published Apr 30 • 217

Recursive Multi-Agent Systems

Paper • 2604.25917 • Published Apr 28 • 273

liked a dataset about 2 months ago

YennNing/MC-Search

Viewer • Updated Feb 22 • 3.33k • 778 • 28

Gaotang Li

AI & ML interests

Recent Activity

Organizations

gaotang's activity