EdgeN - a embedl Collection

embedl 's Collections

NVIDIA Jetson Orin Nano

NVIDIA Jetson AGX Orin

NVIDIA Jetson AGX Thor

EdgeN

updated Apr 29

Quantization strategy where most weights are converted to INT4, activations remain in FP16, and sensitive layers are preserved in FP16.

embedl/Cosmos-Reason2-2B-W4A16-Edge2

Image-Text-to-Text • 2B • Updated May 19 • 541 • 13
embedl/Cosmos-Reason2-2B-W4A16-Edge2-FlashHead

Image-Text-to-Text • 2B • Updated May 19 • 2.34k • 9
Running

7

Edge Inference Benchmarks

🚀

7

On-Device benchmarks across devices and models.