Darshan Deshpande

DarshanDeshpande

·

http://darshandeshpande.github.io

AI & ML interests

Explainability, Robustness, Evaluations

Recent Activity

upvoted a paper 3 days ago

Masked Diffusion Language Models are Strong and Steerable Text-Based World Models for Agentic RL

new activity 3 days ago

PatronusAI/world_model_corpus:Add reinforcement-learning task category, paper and GitHub links

submitted a paper 3 days ago

Masked Diffusion Language Models are Strong and Steerable Text-Based World Models for Agentic RL

View all activity

Organizations

Papers 4

arxiv:2510.01353

arxiv:2505.08638

arxiv:2503.19193

arxiv:2412.14140

models 9

DarshanDeshpande/sherllama3_ia3

Updated Apr 24, 2024

DarshanDeshpande/gemma_2b_oasst1_reward_model

Updated Mar 15, 2024 • 3

DarshanDeshpande/gemma_2b_oasst1_ppo_model

Reinforcement Learning • Updated Mar 14, 2024 • 2

DarshanDeshpande/distilbert_eli5_reward_model

Text Classification • 67M • Updated Mar 12, 2024 • 2

DarshanDeshpande/distilbert_social_reasoning_reward_model

Text Classification • 67M • Updated Mar 10, 2024 • 5

DarshanDeshpande/gemma_2b_social_reasoning_reward_model

Updated Mar 10, 2024

DarshanDeshpande/gemma_2b_anthropic_reward_model

Updated Mar 9, 2024

DarshanDeshpande/gemma-2b-lora-commonsense-qa

Updated Mar 6, 2024

DarshanDeshpande/marathi-distilbert

Fill-Mask • Updated Mar 23, 2021 • 16 • 3

datasets 0

None public yet