Spaces:

Vishinka
/

Code_LLM

Running

App Files Files Community

AnatoliiG commited on 1 day ago

Commit

047143f

1 Parent(s): 1080c74

fix repeat haluc

Browse files

Files changed (2) hide show

src/core/engine.py +1 -0
src/ui/callbacks.py +32 -13

src/core/engine.py CHANGED Viewed

@@ -49,6 +49,7 @@ class ModelEngine:
             "max_tokens": int(kwargs.get("max_tokens", settings.DEFAULT_MAX_TOKENS)),
             "temperature": float(kwargs.get("temperature", settings.DEFAULT_TEMP)),
             "top_p": float(kwargs.get("top_p", 0.95)),
             "stop": kwargs.get("stop", []),
             "stream": stream_mode,
         }

             "max_tokens": int(kwargs.get("max_tokens", settings.DEFAULT_MAX_TOKENS)),
             "temperature": float(kwargs.get("temperature", settings.DEFAULT_TEMP)),
             "top_p": float(kwargs.get("top_p", 0.95)),
+            "repeat_penalty": float(kwargs.get("repeat_penalty", 1.15)),
             "stop": kwargs.get("stop", []),
             "stream": stream_mode,
         }

src/ui/callbacks.py CHANGED Viewed

@@ -35,16 +35,33 @@ def set_interactive(is_interactive):
 def bot_response(
     history, system_prompt, temperature, max_tokens, use_search, uploaded_file
 ):
-    # ПРЕДОХРАНИТЕЛЬ: Запрещаем основной модели выводить технические команды текстом.
-    system_guard = (
-        "\n\n[ВАЖНО]: Отвечай пользователю напрямую обычным текстом. "
-        "КАТЕГОРИЧЕСКИ ЗАПРЕЩАЕТСЯ выводить технические команды, массивы или JSON-вызовы (например [{'type': 'search'}]). "
-        "Если тебе нужно рассуждать перед ответом, оборачивай свои мысли СТРОГО в теги <think>твои мысли</think>."
-    )
-    messages = [{"role": "system", "content": system_prompt + system_guard}]
     file_info, file_content = "", ""
-    # --- 1. ОБРАБОТКА ФАЙЛА ---
     if uploaded_file and os.path.exists(uploaded_file):
         filename = os.path.basename(uploaded_file)
         size_kb = os.path.getsize(uploaded_file) / 1024
@@ -56,7 +73,7 @@ def bot_response(
         if "[Ошибка" in file_content:
             file_info = f"❌ **Ошибка файла:** `{filename}`"
-    # --- 2. ОЧИСТКА И ФОРМИРОВАНИЕ ИСТОРИИ ---
     for msg in history[-7:]:
         content = str(msg["content"])
         if msg["role"] == "assistant":
@@ -68,7 +85,7 @@ def bot_response(
             content = re.sub(r"<details.*?>.*?</details>", "", content, flags=re.DOTALL)
             content = re.sub(r"<think>.*?</think>", "", content, flags=re.DOTALL)
-            # ИСПРАВЛЕНИЕ: Вырезаем технические массивы поиска, если они проскочили в прошлых ответах
             content = re.sub(
                 r"\[\s*\{.*?['\"]type['\"]\s*:\s*['\"]search['\"].*?\}\s*\]",
                 "",
@@ -85,7 +102,7 @@ def bot_response(
     history.append({"role": "assistant", "content": "⏳ Инициализация..."})
     yield history
-    # --- 3. АГЕНТ ПОИСКА (РОУТЕР) ---
     search_info = ""
     if use_search:
         history[-1]["content"] = (
@@ -114,7 +131,7 @@ def bot_response(
             eval_response = engine.generate(
                 messages=agent_messages,
                 max_tokens=150,
-                temperature=0.0,  # Обязательно 0! Нам нужна точность, а не креатив.
                 stream=False,
             )
@@ -150,6 +167,7 @@ def bot_response(
             print(f"Ошибка Роутера: {e}")
             search_info = "⚡ Ошибка роутера. Отвечаю из базы знаний."
     if file_content:
         messages[0]["content"] += (
             f"\n\nСодержимое файла '{os.path.basename(uploaded_file)}':\n\n{file_content}"
@@ -164,12 +182,13 @@ def bot_response(
     history[-1]["content"] = status_header + "⏳ Генерация ответа..."
     yield history
-    # --- 4. СТРИМИНГ И УМНЫЙ UI ---
     try:
         stream = engine.generate(
             messages=messages,
             max_tokens=max_tokens,
             temperature=temperature,
             stream=True,
         )
         partial_text = ""

 def bot_response(
     history, system_prompt, temperature, max_tokens, use_search, uploaded_file
 ):
+    # --- 1. ДИНАМИЧЕСКИЙ ПРОМПТ И ПРЕДОХРАНИТЕЛЬ ---
+    actual_sys_prompt = system_prompt
+    if use_search:
+        system_guard = (
+            "\n\n[ВАЖНО]: Отвечай пользователю напрямую обычным текстом. "
+            "КАТЕГОРИЧЕСКИ ЗАПРЕЩАЕТСЯ выводить технические команды, массивы или JSON-вызовы (например [{'type': 'search'}]). "
+            "Если тебе нужно рассуждать перед ответом, оборачивай свои мысли СТРОГО в теги <think>твои мысли</think>."
+        )
+    else:
+        # Если галочка поиска выключена, удаляем из системного промпта призыв искать
+        actual_sys_prompt = actual_sys_prompt.replace(
+            "Если нужно узнать свежую информацию, используйте поиск.", ""
+        )
+        system_guard = (
+            "\n\n[СИСТЕМНОЕ УВЕДОМЛЕНИЕ]: ВНИМАНИЕ! Функция поиска в интернете сейчас ОТКЛЮЧЕНА. "
+            "Ты ДОЛЖЕН ответить, используя только свои внутренние знания. "
+            "НИ В КОЕМ СЛУЧАЕ не пытайся генерировать команды поиска (например [{'type': 'search'}]). "
+            "Просто дай лучший ответ, который можешь, основываясь на своей памяти. "
+            "Если тебе нужно рассуждать, используй теги <think>мысли</think>."
+        )
+    messages = [{"role": "system", "content": actual_sys_prompt + system_guard}]
     file_info, file_content = "", ""
+    # --- 2. ОБРАБОТКА ФАЙЛА ---
     if uploaded_file and os.path.exists(uploaded_file):
         filename = os.path.basename(uploaded_file)
         size_kb = os.path.getsize(uploaded_file) / 1024
         if "[Ошибка" in file_content:
             file_info = f"❌ **Ошибка файла:** `{filename}`"
+    # --- 3. ОЧИСТКА И ФОРМИРОВАНИЕ ИСТОРИИ ---
     for msg in history[-7:]:
         content = str(msg["content"])
         if msg["role"] == "assistant":
             content = re.sub(r"<details.*?>.*?</details>", "", content, flags=re.DOTALL)
             content = re.sub(r"<think>.*?</think>", "", content, flags=re.DOTALL)
+            # Вырезаем технические массивы поиска, если они проскочили в прошлых ответах
             content = re.sub(
                 r"\[\s*\{.*?['\"]type['\"]\s*:\s*['\"]search['\"].*?\}\s*\]",
                 "",
     history.append({"role": "assistant", "content": "⏳ Инициализация..."})
     yield history
+    # --- 4. АГЕНТ ПОИСКА (РОУТЕР) ---
     search_info = ""
     if use_search:
         history[-1]["content"] = (
             eval_response = engine.generate(
                 messages=agent_messages,
                 max_tokens=150,
+                temperature=0.0,  # Обязательно 0 для точности!
                 stream=False,
             )
             print(f"Ошибка Роутера: {e}")
             search_info = "⚡ Ошибка роутера. Отвечаю из базы знаний."
+    # Добавляем контент файла в начало (чтобы модель опиралась на него при ответе)
     if file_content:
         messages[0]["content"] += (
             f"\n\nСодержимое файла '{os.path.basename(uploaded_file)}':\n\n{file_content}"
     history[-1]["content"] = status_header + "⏳ Генерация ответа..."
     yield history
+    # --- 5. СТРИМИНГ И УМНЫЙ UI ---
     try:
         stream = engine.generate(
             messages=messages,
             max_tokens=max_tokens,
             temperature=temperature,
+            repeat_penalty=1.15,  # Штраф за зацикливание текста
             stream=True,
         )
         partial_text = ""