OpenEvals

community

AI & ML interests

LLM evaluation

Recent Activity

nielsr submitted a paper 11 days ago

MonkeyOCRv2: A Visual-Text Foundation Model for Document AI

nielsr submitted a paper 12 days ago

Xiaomi-Robotics-U0: Unified Embodied Synthesis with World Foundation Model

nielsr submitted a paper 17 days ago

Single-Rollout Asynchronous Optimization for Agentic Reinforcement Learning

View all activity

OpenEvals 's datasets 5

OpenEvals/leaderboard-data

Viewer • Updated Mar 28 • 105 • 1.83k • 1

OpenEvals/IMO-AnswerBench

Viewer • Updated Jan 23 • 400 • 622 • 2

OpenEvals/MuSR

Viewer • Updated Dec 12, 2025 • 756 • 90

OpenEvals/aime_24

Viewer • Updated Dec 12, 2025 • 30 • 30 • 1

OpenEvals/SimpleQA

Viewer • Updated Dec 12, 2025 • 4.33k • 887 • 4