Generation - a Julius-L Collection

Julius-L 's Collections

inference acceleration

multimodal dataset

Memory Efficient Training

Model Architecture

LLM Technical Reports

Generation

updated Nov 1, 2024

Fast Best-of-N Decoding via Speculative Rejection

Paper • 2410.20290 • Published Oct 26, 2024 • 10