Arvind Rajasekaran PRO

arvindcr4

·

AI & ML interests

None yet

Organizations

None yet

arvindcr4 's models 42

arvindcr4/tinker-rl-w1_deepseek-v31-base-deepseek-v3.1-base-s42

arvindcr4/tinker-rl-frontier_gsm8k_nemotron-120b-nemotron-120b

Reinforcement Learning • Updated Apr 19

arvindcr4/tinker-rl-frontier_gsm8k_deepseek-v3.1-deepseek-v3.1

Reinforcement Learning • Updated Apr 19

arvindcr4/tinker-rl-arch_gsm8k_kimi-k2-kimi-k2

Reinforcement Learning • Updated Apr 19

arvindcr4/tinker-rl-w2_qwen3-8b_g4-qwen3-8b-s42

Reinforcement Learning • Updated Apr 19

arvindcr4/tinker-rl-w2_qwen3-8b_g32-qwen3-8b-s42

Reinforcement Learning • Updated Apr 19

arvindcr4/tinker-rl-w2_qwen3-8b_g2-qwen3-8b-s42

Reinforcement Learning • Updated Apr 19

arvindcr4/tinker-rl-w2_qwen3-8b_g16-qwen3-8b-s42

Reinforcement Learning • Updated Apr 19

arvindcr4/tinker-rl-w1_qwen3-8b-base-qwen3-8b-base-s42-run1

Reinforcement Learning • Updated Apr 19

arvindcr4/tinker-rl-w1_qwen3-8b-base-qwen3-8b-base-s42-run2

Reinforcement Learning • Updated Apr 19

arvindcr4/tinker-rl-w1_llama31-8b-base-llama-3.1-8b-s42

Reinforcement Learning • Updated Apr 19

arvindcr4/tinker-rl-scale_gsm8k_qwen3.5-4b-qwen3.5-4b

Reinforcement Learning • Updated Apr 19

arvindcr4/tinker-rl-scale_gsm8k_qwen3-8b-qwen3-8b

Reinforcement Learning • Updated Apr 19

arvindcr4/tinker-rl-scale_gsm8k_llama-8b-inst-llama-8b-inst

Reinforcement Learning • Updated Apr 19

arvindcr4/tinker-rl-distillation_off_trajectory-qwen3-8b-base

Reinforcement Learning • Updated Apr 19

arvindcr4/tinker-rl-cross_tool_qwen3-32b-qwen3-32b

Reinforcement Learning • Updated Apr 19

arvindcr4/tinker-rl-cross_tool_llama-8b-inst-llama-8b-inst

Reinforcement Learning • Updated Apr 19

arvindcr4/tinker-rl-atropos_notebook-qwen3-8b-base

Reinforcement Learning • Updated Apr 19

arvindcr4/tinker-rl-arithmetic_trajectory-llama-3.2-1b

Reinforcement Learning • Updated Apr 19

arvindcr4/tinker-rl-arch_gsm8k_gpt-oss-20b-gpt-oss-20b

Reinforcement Learning • Updated Apr 19

arvindcr4/trl_qwen3_8b-grpo-gsm8k

arvindcr4/trl_llama32_3b-grpo-gsm8k

arvindcr4/trl_llama32_1b-grpo-gsm8k

arvindcr4/tinker-rl-bench-arch_gsm8k_kimi-k2

Reinforcement Learning • Updated Apr 19

arvindcr4/tinker-rl-bench-arch_gsm8k_gpt-oss-20b

Reinforcement Learning • Updated Apr 19

arvindcr4/tinker-rl-bench-scale_gsm8k_llama-8b-inst

Reinforcement Learning • Updated Apr 19

arvindcr4/tinker-rl-bench-cross_tool_qwen3-32b

Reinforcement Learning • Updated Apr 19

arvindcr4/tinker-rl-bench-scale_gsm8k_qwen3.5-4b

Reinforcement Learning • Updated Apr 19

arvindcr4/tinker-rl-bench-frontier_gsm8k_nemotron-120b

Reinforcement Learning • Updated Apr 19

arvindcr4/tinker-rl-bench-ppo_gsm8k_Qwen3-8B_s42

Text Generation • Updated Apr 19 • 2