ProfEngel
/

OwlLM2-e2b

Model card Files Files and versions

ProfEngel commited on Jul 22, 2025

Commit

e111912

·

verified ·

1 Parent(s): e009843

Update README.md

Files changed (1) hide show

README.md +18 -4

README.md CHANGED Viewed

@@ -1,3 +1,11 @@
 # ModelCard – OwlLM2 **Controlling-Experte**
 ## Modellübersicht
@@ -34,7 +42,7 @@ OwlLM2 ist eine speziell auf deutsches Controlling und Rechnungswesen finegetune
 | Parameter | Wert |
 | :-- | :-- |
-| **GPU** | NVIDIA T4 (16GB VRAM) |
 | **Trainingsdauer** | 76,76 Minuten (4.605,80 Sekunden) |
 | **Peak Memory** | 8,268 GB (37,31% der verfügbaren VRAM) |
 | **Training Memory** | 0,62 GB (2,80% für LoRA-Training) |
@@ -84,15 +92,15 @@ OwlLM2 wird in verschiedenen optimierten Formaten bereitgestellt:
 ### **Vollständiges Modell (Safetensors)**
 - **Format:** vLLM-kompatible Safetensors
-- **Größe:** ~5-6 GB
 - **Verwendung:** Direkter Einsatz ohne Basis-Modell
 - **Ideal für:** Production-Deployments
 ### **GGUF-Quantisierung**
-- **8-Bit GGUF:** ~2-3 GB, optimiert für CPU/kleine GPUs
-- **4-Bit GGUF:** ~1-2 GB, maximale Kompression
 - **Ideal für:** Edge-Computing, lokale Anwendungen
@@ -319,3 +327,9 @@ Für Fragen, Verbesserungsvorschläge oder spezielle Anwendungsfälle im deutsch
 - Kann Fehler enthalten oder veraltete Informationen wiedergeben
 Entscheidungen, die auf Basis der Modell-Ausgaben getroffen werden, erfolgen auf eigenes Risiko und eigene Verantwortung.

+---
+license: apache-2.0
+language:
+- de
+base_model:
+- google/gemma-3n-E2B-it
+pipeline_tag: text-to-speech
+---
 # ModelCard – OwlLM2 **Controlling-Experte**
 ## Modellübersicht
 | Parameter | Wert |
 | :-- | :-- |
+| **GPU** | NVIDIA L4 (24GB VRAM) |
 | **Trainingsdauer** | 76,76 Minuten (4.605,80 Sekunden) |
 | **Peak Memory** | 8,268 GB (37,31% der verfügbaren VRAM) |
 | **Training Memory** | 0,62 GB (2,80% für LoRA-Training) |
 ### **Vollständiges Modell (Safetensors)**
 - **Format:** vLLM-kompatible Safetensors
+- **Größe:** ~7-9 GB
 - **Verwendung:** Direkter Einsatz ohne Basis-Modell
 - **Ideal für:** Production-Deployments
 ### **GGUF-Quantisierung**
+- **8-Bit GGUF:** ~4-5 GB, optimiert für CPU/kleine GPUs
+- **4-Bit GGUF:** ~1-2 GB, maximale Kompression (noch nicht verfügbar!)
 - **Ideal für:** Edge-Computing, lokale Anwendungen
 - Kann Fehler enthalten oder veraltete Informationen wiedergeben
 Entscheidungen, die auf Basis der Modell-Ausgaben getroffen werden, erfolgen auf eigenes Risiko und eigene Verantwortung.
+**OwlLM2 – Ihr KI-gestützter Partner für professionelles Controlling**
+<div style="text-align: center">⁂</div>
+[^1]: Gemma3N_-4B-_Conversational.ipynb