wang's picture

8

wang

astrid01052

AI & ML interests

None yet

Recent Activity

upvoted a paper about 13 hours ago

ComBench: A Benchmark for Rigorous Proof Reasoning and Constructive Realization in Olympiad-Level Combinatorics

upvoted a paper 4 days ago

SubtleMemory: A Benchmark for Fine-Grained Relational Memory Discrimination in Long-Horizon AI Agents

upvoted a paper 21 days ago

π-Bench: Evaluating Proactive Personal Assistant Agents in Long-Horizon Workflows

View all activity

Organizations

None yet

astrid01052 's papers 1

arxiv:2602.09443