Spaces:

MathFrames
/

manim-render-api

Sleeping

App Files Files Community

Verdiola commited on Oct 27, 2025

Commit

9aa17d8

verified ·

1 Parent(s): 40f773e

try to fix got5-mini

Browse files

Files changed (1) hide show

app/main.py +55 -6

app/main.py CHANGED Viewed

@@ -34,6 +34,32 @@ OPENAI_API_KEY = os.getenv("OPENAI_API_KEY")
 USE_OPENAI = os.getenv("USE_OPENAI", "").lower() == "true"
 PORT    = int(os.getenv("PORT", "7860"))
 gemini_client = genai.Client(api_key=API_KEY) if API_KEY else None
 gpt_client = OpenAI(api_key=OPENAI_API_KEY) if (OPENAI_API_KEY and OpenAI and USE_OPENAI) else None
@@ -162,6 +188,21 @@ def _build_responses_input(system: str, contents: Any) -> List[Dict[str, Any]]:
         {"role": "user", "content": _build_openai_content(contents, for_chat=False)},
     ]
 def _extract_chat_content(resp: Any) -> str:
     content = resp.choices[0].message.content
@@ -199,17 +240,22 @@ def _invoke_gpt_model(model: str, system: str, contents: Any) -> str:
     if not gpt_client:
         raise RuntimeError("GPT client is not configured")
     messages = _build_chat_messages(system, contents)
     try:
         resp = gpt_client.chat.completions.create(model=model, messages=messages)
         return _extract_chat_content(resp)
     except Exception as err:
-        message = str(err)
-        if "only supported in v1/responses" not in message:
             raise
-        resp = gpt_client.responses.create(
-            model=model,
-            input=_build_responses_input(system, contents),
-        )
         return _extract_responses_content(resp)
@@ -218,6 +264,7 @@ def gemini_call(*, system: str, contents):
     if not gemini_client:
         raise RuntimeError("Gemini client is not configured")
     limiter.acquire()
     resp = gemini_client.models.generate_content(
         model=MODEL,
         config=types.GenerateContentConfig(system_instruction=system),
@@ -231,10 +278,12 @@ def gemini_small_call(*, system: str, contents: str) -> str:
     storyboard_limiter.acquire()
     if gpt_client:
         target_model = OPENAI_SMALL_MODEL
         return _invoke_gpt_model(target_model, system, contents)
     if not gemini_client:
         raise RuntimeError("Gemini client is not configured")
     fallback_model = GEMINI_SMALL_MODEL or MODEL
     resp = gemini_client.models.generate_content(
         model=fallback_model,
         config=types.GenerateContentConfig(system_instruction=system),

 USE_OPENAI = os.getenv("USE_OPENAI", "").lower() == "true"
 PORT    = int(os.getenv("PORT", "7860"))
+_OPENAI_RESPONSES_MODELS_ENV = os.getenv("OPENAI_RESPONSES_MODELS", "")
+RESPONSES_API_MODEL_NAMES = {"gpt-5-mini"}
+if _OPENAI_RESPONSES_MODELS_ENV:
+    RESPONSES_API_MODEL_NAMES.update(
+        model.strip().lower()
+        for model in _OPENAI_RESPONSES_MODELS_ENV.split(",")
+        if model.strip()
+    )
+_OPENAI_RESPONSES_PREFIXES_ENV = os.getenv("OPENAI_RESPONSES_PREFIXES", "")
+_RESPONSES_API_MODEL_PREFIXES = ["gpt-5"]
+if _OPENAI_RESPONSES_PREFIXES_ENV:
+    _RESPONSES_API_MODEL_PREFIXES.extend(
+        prefix.strip().lower()
+        for prefix in _OPENAI_RESPONSES_PREFIXES_ENV.split(",")
+        if prefix.strip()
+    )
+RESPONSES_API_MODEL_PREFIXES = tuple(_RESPONSES_API_MODEL_PREFIXES)
+RESPONSES_API_ERROR_HINTS = (
+    "only supported in v1/responses",
+    "use the responses api",
+    "use the responses endpoint",
+    "please call the responses api",
+    "please use the responses endpoint",
+)
 gemini_client = genai.Client(api_key=API_KEY) if API_KEY else None
 gpt_client = OpenAI(api_key=OPENAI_API_KEY) if (OPENAI_API_KEY and OpenAI and USE_OPENAI) else None
         {"role": "user", "content": _build_openai_content(contents, for_chat=False)},
     ]
+def _requires_responses_api(model: str) -> bool:
+    lowered = (model or "").lower()
+    if not lowered:
+        return False
+    if lowered in RESPONSES_API_MODEL_NAMES:
+        return True
+    return any(
+        prefix and lowered.startswith(prefix)
+        for prefix in RESPONSES_API_MODEL_PREFIXES
+    )
+def _should_use_responses_fallback(err: Exception) -> bool:
+    message = str(err).lower()
+    return any(hint in message for hint in RESPONSES_API_ERROR_HINTS)
 def _extract_chat_content(resp: Any) -> str:
     content = resp.choices[0].message.content
     if not gpt_client:
         raise RuntimeError("GPT client is not configured")
     messages = _build_chat_messages(system, contents)
+    print(f"[Storyboard] OpenAI request model={model}", file=sys.stderr)
+    responses_input: Optional[List[Dict[str, Any]]] = None
+    if _requires_responses_api(model):
+        responses_input = _build_responses_input(system, contents)
+        resp = gpt_client.responses.create(model=model, input=responses_input)
+        return _extract_responses_content(resp)
     try:
         resp = gpt_client.chat.completions.create(model=model, messages=messages)
         return _extract_chat_content(resp)
     except Exception as err:
+        if not _should_use_responses_fallback(err):
             raise
+        if responses_input is None:
+            responses_input = _build_responses_input(system, contents)
+        print(f"[Storyboard] OpenAI responses fallback model={model}", file=sys.stderr)
+        resp = gpt_client.responses.create(model=model, input=responses_input)
         return _extract_responses_content(resp)
     if not gemini_client:
         raise RuntimeError("Gemini client is not configured")
     limiter.acquire()
+    print(f"[Storyboard] Gemini request model={MODEL}", file=sys.stderr)
     resp = gemini_client.models.generate_content(
         model=MODEL,
         config=types.GenerateContentConfig(system_instruction=system),
     storyboard_limiter.acquire()
     if gpt_client:
         target_model = OPENAI_SMALL_MODEL
+        print(f"[Storyboard] Using OpenAI small model={target_model}", file=sys.stderr)
         return _invoke_gpt_model(target_model, system, contents)
     if not gemini_client:
         raise RuntimeError("Gemini client is not configured")
     fallback_model = GEMINI_SMALL_MODEL or MODEL
+    print(f"[Storyboard] OpenAI disabled; using Gemini fallback model={fallback_model}", file=sys.stderr)
     resp = gemini_client.models.generate_content(
         model=fallback_model,
         config=types.GenerateContentConfig(system_instruction=system),