MoonkaAI

Локальный русскоязычный ассистент, дообученный через Unsloth 4-bit LoRA.

Параметры

  • База: unsloth/tinyllama-bnb-4bit
  • Формат диалога: ChatML (<|im_start|>user/assistant)
  • LoRA rank: 16
  • Контекст обучения: 2048
  • Лимит входа при подготовке: 600 токенов
  • Лимит ответа при подготовке: 1500 токенов
  • GGUF: q4_k_m

Данные

{
  "total_records": 550,
  "train_records": 522,
  "eval_records": 28,
  "ru_records": 500,
  "style_records": 50,
  "max_seq_length": 2048,
  "max_input_tokens": 600,
  "max_output_tokens": 1500
}

Локальный запуск

python run.py --repo-id luezr/moonkaAI --threads 6 --rag auto

Модель маленькая, поэтому стиль и факты будут ограничены размером TinyLlama.

Downloads last month
-
GGUF
Model size
1B params
Architecture
llama
Hardware compatibility
Log In to add your hardware

4-bit

Inference Providers NEW
This model isn't deployed by any Inference Provider. 🙋 Ask for provider support

Model tree for luezr/moonkaAI

Adapter
(39)
this model

Dataset used to train luezr/moonkaAI