Antigravity Bot commited on
Commit
cce9bd3
·
1 Parent(s): 17ff855

Force Tokenizer limit to 16k

Browse files
Files changed (1) hide show
  1. app.py +15 -5
app.py CHANGED
@@ -1,9 +1,19 @@
1
- import gradio as gr
2
- from transformers import pipeline
3
 
4
- # 1. Carrega o modelo (DeepSeek R1 para raciocínio)
5
- # Forçamos o uso de config personalizada para garantir que ele não limite em 4k
6
- pipe = pipeline("text-generation", model="deepseek-ai/DeepSeek-R1-Distill-Llama-8B", device_map="cpu", torch_dtype="auto", model_kwargs={"max_length": 16384})
 
 
 
 
 
 
 
 
 
 
 
7
 
8
  def predict(message, history):
9
  """
 
1
+ from transformers import pipeline, AutoTokenizer, AutoModelForCausalLM
 
2
 
3
+ # 1. Carrega Tokenizer e Modelo separadamente para garantir o controle do Contexto
4
+ model_id = "deepseek-ai/DeepSeek-R1-Distill-Llama-8B"
5
+ tokenizer = AutoTokenizer.from_pretrained(model_id)
6
+ # Força o tokenizer a entender que aceitamos até 16k tokens (DeepSeek suporta 128k, mas RAM limita)
7
+ tokenizer.model_max_length = 16384
8
+
9
+ model = AutoModelForCausalLM.from_pretrained(
10
+ model_id,
11
+ device_map="cpu",
12
+ torch_dtype="auto",
13
+ max_length=16384
14
+ )
15
+
16
+ pipe = pipeline("text-generation", model=model, tokenizer=tokenizer)
17
 
18
  def predict(message, history):
19
  """