1 7 10

SII-Yakun Zhu

shzyk

shzyk

AI & ML interests

None yet

Recent Activity

authored a paper 1 day ago

MedMCP-Calc: Benchmarking LLMs for Realistic Medical Calculator Scenarios via MCP Integration

upvoted a paper 1 day ago

DiagnosisArena: Benchmarking Diagnostic Reasoning for Large Language Models

upvoted a paper 1 day ago

MeNTi: Bridging Medical Calculator and LLM Agent with Nested Tool Calling

View all activity

Organizations

None yet

authored a paper 1 day ago

MedMCP-Calc: Benchmarking LLMs for Realistic Medical Calculator Scenarios via MCP Integration

Paper • 2601.23049 • Published 12 days ago • 1

upvoted 4 papers 1 day ago

DiagnosisArena: Benchmarking Diagnostic Reasoning for Large Language Models

Paper • 2505.14107 • Published May 20, 2025 • 1

MeNTi: Bridging Medical Calculator and LLM Agent with Nested Tool Calling

Paper • 2410.13610 • Published Oct 17, 2024 • 1

CP-Env: Evaluating Large Language Models on Clinical Pathways in a Controllable Hospital Environment

Paper • 2512.10206 • Published Dec 11, 2025 • 1

MOVA: Towards Scalable and Synchronized Video-Audio Generation

Paper • 2602.08794 • Published 2 days ago • 142

upvoted 2 papers 7 days ago

MedMCP-Calc: Benchmarking LLMs for Realistic Medical Calculator Scenarios via MCP Integration

Paper • 2601.23049 • Published 12 days ago • 1

daVinci-Agency: Unlocking Long-Horizon Agency Data-Efficiently

Paper • 2602.02619 • Published 9 days ago • 49

liked a dataset about 1 month ago

ncbi/MedCalc-Bench-v1.2

Viewer • Updated Dec 20, 2025 • 11.6k • 671 • 2

liked a dataset about 2 months ago

ncbi/MedCalc-Bench

Viewer • Updated Dec 18, 2025 • 11.6k • 516 • 2

authored 3 papers about 2 months ago

CP-Env: Evaluating Large Language Models on Clinical Pathways in a Controllable Hospital Environment

Paper • 2512.10206 • Published Dec 11, 2025 • 1

MeNTi: Bridging Medical Calculator and LLM Agent with Nested Tool Calling

Paper • 2410.13610 • Published Oct 17, 2024 • 1

DiagnosisArena: Benchmarking Diagnostic Reasoning for Large Language Models

Paper • 2505.14107 • Published May 20, 2025 • 1

upvoted a paper 2 months ago

SpeContext: Enabling Efficient Long-context Reasoning with Speculative Context Sparsity in LLMs

Paper • 2512.00722 • Published Nov 30, 2025 • 16

liked a model 3 months ago

Qwen/Qwen3-30B-A3B-Instruct-2507

Text Generation • 31B • Updated Sep 17, 2025 • 1.73M • • 760

liked a dataset 3 months ago

SII-SPIRAL-MED/DiagnosisArena

Viewer • Updated Sep 28, 2025 • 915 • 265 • 4

updated a dataset 5 months ago

shzyk/DiagnosisArena

Viewer • Updated Sep 19, 2025 • 915 • 1.6k • 8

updated a dataset 9 months ago

shzyk/CalcQA

Updated May 25, 2025 • 5 • 1

liked a dataset 9 months ago

shzyk/CalcQA

Updated May 25, 2025 • 5 • 1

published a dataset 9 months ago

shzyk/CalcQA

Updated May 25, 2025 • 5 • 1

liked a dataset 9 months ago

shzyk/DiagnosisArena

Viewer • Updated Sep 19, 2025 • 915 • 1.6k • 8

SII-Yakun Zhu

AI & ML interests

Recent Activity

Organizations

shzyk's activity