Spaces:

codey-lab
/

Multi-LLM-API-Gateway

Running

Alibrown commited on 4 days ago

Commit

f003440

verified ·

1 Parent(s): da14c12

Update app/providers.py

Files changed (1) hide show

app/providers.py CHANGED Viewed

@@ -179,16 +179,17 @@ class OpenRouterProvider(BaseProvider):
 class HuggingFaceProvider(BaseProvider):
-    """HuggingFace Inference API — chat completions endpoint.
-    Uses /v1/chat/completions (OpenAI-compatible, requires recent models).
-    Legacy models (410 Gone) must be removed from .pyfun models list.
     """
     async def complete(self, prompt: str, model: str = None, max_tokens: int = 512) -> str:
         m    = model or self.model
         data = await self._post(
-            f"{self.base_url}/{m}/v1/chat/completions",
             headers={
                 "Authorization": f"Bearer {self.key}",
                 "content-type":  "application/json",

 class HuggingFaceProvider(BaseProvider):
+    """HuggingFace Inference API — OpenAI-compatible serverless endpoint.
+    base_url in .pyfun: https://api-inference.huggingface.co/v1
+    Model goes in payload, not in URL.
+    Free tier: max ~8B models. PRO required for 70B+.
     """
     async def complete(self, prompt: str, model: str = None, max_tokens: int = 512) -> str:
         m    = model or self.model
         data = await self._post(
+            f"{self.base_url}/chat/completions",
             headers={
                 "Authorization": f"Bearer {self.key}",
                 "content-type":  "application/json",