ruwujiang97

ruwj97

AI & ML interests

None yet

Recent Activity

published a dataset about 2 months ago

MemGym/memgym-dr-instances

published a dataset about 2 months ago

MemGym/memgym-rm-strategy-ood

published a dataset about 2 months ago

MemGym/memgym-rm-scenario-ood-extras

View all activity

Organizations

published 6 datasets about 2 months ago

published a model about 2 months ago

MemGym/memgym-rm-1p7b

Updated May 18

updated 6 datasets about 2 months ago

MemGym/memgym-dr-instances

Preview • Updated May 27 • 146

MemGym/memgym-rm-strategy-ood

Updated May 27 • 9

MemGym/memgym-rm-scenario-ood-extras

Preview • Updated May 27 • 16

MemGym/memgym-rm-scenario-ood-webarena

Viewer • Updated May 27 • 426 • 51

MemGym/memgym-rm-train

Viewer • Updated May 27 • 9.92k • 53

MemGym/memgym-rm-iid-heldout

Viewer • Updated May 27 • 3.01k • 43

upvoted a paper about 2 months ago

Code as Agent Harness

Paper • 2605.18747 • Published May 18 • 224

updated a model 2 months ago

MemGym/memgym-rm-1p7b

Updated May 18

upvoted a paper 2 months ago

MemEye: A Visual-Centric Evaluation Framework for Multimodal Agent Memory

Paper • 2605.15128 • Published May 14 • 64

upvoted a paper 3 months ago

EvoSkills: Self-Evolving Agent Skills via Co-Evolutionary Verification

Paper • 2604.01687 • Published Apr 2 • 8

upvoted a paper 6 months ago

Agentic Reasoning for Large Language Models

Paper • 2601.12538 • Published Jan 18 • 207

upvoted a paper 8 months ago

M3-Bench: Multi-Modal, Multi-Hop, Multi-Threaded Tool-Using MLLM Agent Benchmark

Paper • 2511.17729 • Published Nov 21, 2025 • 17

upvoted a paper 9 months ago

Generalizing Test-time Compute-optimal Scaling as an Optimizable Graph

Paper • 2511.00086 • Published Oct 29, 2025 • 42

ruwujiang97

AI & ML interests

Recent Activity

Organizations

ruwj97's activity