Reasonning - a JM-Brun Collection

JM-Brun 's Collections

Diffusion models

Prompt Optimization

LLM Architecture

Interpretability XAI

Reasonning

updated Jul 3, 2025

OmniThink: Expanding Knowledge Boundaries in Machine Writing through Thinking

Paper • 2501.09751 • Published Jan 16, 2025 • 45
Towards Large Reasoning Models: A Survey of Reinforced Reasoning with Large Language Models

Paper • 2501.09686 • Published Jan 23, 2025 • 41
DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via Reinforcement Learning

Paper • 2501.12948 • Published Jan 22, 2025 • 457
s1: Simple test-time scaling

Paper • 2501.19393 • Published Jan 31, 2025 • 126
Reward-Guided Speculative Decoding for Efficient LLM Reasoning

Paper • 2501.19324 • Published Jan 31, 2025 • 39
ZebraLogic: On the Scaling Limits of LLMs for Logical Reasoning

Paper • 2502.01100 • Published Feb 3, 2025 • 21
Satori: Reinforcement Learning with Chain-of-Action-Thought Enhances LLM Reasoning via Autoregressive Search

Paper • 2502.02508 • Published Feb 4, 2025 • 22
LIMO: Less is More for Reasoning

Paper • 2502.03387 • Published Feb 5, 2025 • 62
A Probabilistic Inference Approach to Inference-Time Scaling of LLMs using Particle-Based Monte Carlo Methods

Paper • 2502.01618 • Published Feb 3, 2025 • 10
Token Assorted: Mixing Latent and Text Tokens for Improved Language Model Reasoning

Paper • 2502.03275 • Published Feb 5, 2025 • 18
MME-CoT: Benchmarking Chain-of-Thought in Large Multimodal Models for Reasoning Quality, Robustness, and Efficiency

Paper • 2502.09621 • Published Feb 13, 2025 • 28
Logical Reasoning in Large Language Models: A Survey

Paper • 2502.09100 • Published Feb 13, 2025 • 23
Chain of Draft: Thinking Faster by Writing Less

Paper • 2502.18600 • Published Feb 25, 2025 • 50
Sketch-of-Thought: Efficient LLM Reasoning with Adaptive Cognitive-Inspired Sketching

Paper • 2503.05179 • Published Mar 7, 2025 • 46
Efficient Reasoning Models: A Survey

Paper • 2504.10903 • Published Apr 15, 2025 • 21
xVerify: Efficient Answer Verifier for Reasoning Model Evaluations

Paper • 2504.10481 • Published Apr 14, 2025 • 85
VerifiAgent: a Unified Verification Agent in Language Model Reasoning

Paper • 2504.00406 • Published Apr 1, 2025 • 8
Could Thinking Multilingually Empower LLM Reasoning?

Paper • 2504.11833 • Published Apr 16, 2025 • 29
Thought Manipulation: External Thought Can Be Efficient for Large Reasoning Models

Paper • 2504.13626 • Published Apr 18, 2025 • 7
Phi-4-reasoning Technical Report

Paper • 2504.21318 • Published Apr 30, 2025 • 56
Knowledge Augmented Complex Problem Solving with Large Language Models: A Survey

Paper • 2505.03418 • Published May 6, 2025 • 9
Reasoning Models Better Express Their Confidence

Paper • 2505.14489 • Published May 20, 2025 • 20
Reflect, Retry, Reward: Self-Improving LLMs via Reinforcement Learning

Paper • 2505.24726 • Published May 30, 2025 • 283
RuleReasoner: Reinforced Rule-based Reasoning via Domain-aware Dynamic Sampling

Paper • 2506.08672 • Published Jun 10, 2025 • 30
The Automated LLM Speedrunning Benchmark: Reproducing NanoGPT Improvements

Paper • 2506.22419 • Published Jun 27, 2025 • 15
In-Context Learning Strategies Emerge Rationally

Paper • 2506.17859 • Published Jun 21, 2025 • 10