Spaces:

FlashCode-Lab
/

super-ai-brain

Running

App Files Files Community

FlashCode-Lab commited on 12 days ago

Commit

2901b24

verified ·

1 Parent(s): 809c3af

Update app.py

Browse files

Files changed (1) hide show

app.py +35 -29

app.py CHANGED Viewed

@@ -4,50 +4,56 @@ from langchain_huggingface import HuggingFaceEndpoint, HuggingFaceEmbeddings
 from langchain_community.vectorstores import FAISS
 from langchain_community.document_loaders import TextLoader
 from langchain_text_splitters import CharacterTextSplitter
-from langchain.chains.retrieval_qa.base import RetrievalQA
-# 1. 初始化大模型 - 增加具体参数以绕过版本冲突
 llm = HuggingFaceEndpoint(
     repo_id="Qwen/Qwen2.5-7B-Instruct",
     huggingfacehub_api_token=os.getenv("HF_TOKEN"),
-    task="text-generation",
-    # 强制不使用旧版的 post 属性
-    client_kwargs={"headers": {"Authorization": f"Bearer {os.getenv('HF_TOKEN')}"}}
 )
-# 2. 知识库自动化处理
-if not os.path.exists("knowledge.txt") or os.path.getsize("knowledge.txt") == 0:
-    with open("knowledge.txt", "w", encoding="utf-8") as f:
-        f.write("私有大脑知识库已激活。")
-loader = TextLoader("knowledge.txt", encoding="utf-8")
-docs = CharacterTextSplitter(chunk_size=500, chunk_overlap=50).split_documents(loader.load())
-embeddings = HuggingFaceEmbeddings(model_name="BAAI/bge-small-zh-v1.5")
-vectorstore = FAISS.from_documents(docs, embeddings)
-# 3. 构建问答链
 qa_chain = RetrievalQA.from_chain_type(
     llm=llm,
-    retriever=vectorstore.as_retriever(search_kwargs={"k": 3})
 )
-# 4. 修复聊天逻辑
-def chat_response(message, history):
     try:
-        # 使用 invoke 进行标准调用
-        response = qa_chain.invoke({"query": message})
-        return response["result"]
     except Exception as e:
-        # 针对常见 API 错误的友好提示
-        if "attribute 'post'" in str(e):
-            return "正在尝试兼容新版接口，请稍后再试或点击 Settings 重启一次。"
-        return f"大脑思考中遇到挑战：{str(e)}"
-# 5. 启动界面
 demo = gr.ChatInterface(
-    chat_response,
-    title="全能私有大脑 v2.2",
-    description="接口兼容性已修复。如果仍然报错，请点击设置进行 Factory Restart。"
 )
 if __name__ == "__main__":

 from langchain_community.vectorstores import FAISS
 from langchain_community.document_loaders import TextLoader
 from langchain_text_splitters import CharacterTextSplitter
+from langchain.chains import RetrievalQA
+# 1. 配置大模型 - 换一种更稳健的连接方式
+# 我们明确指定使用异步/同步通用的传输协议
 llm = HuggingFaceEndpoint(
     repo_id="Qwen/Qwen2.5-7B-Instruct",
     huggingfacehub_api_token=os.getenv("HF_TOKEN"),
+    timeout=300,
+    task="text-generation" # 明确任务类型
 )
+# 2. 知识库加载逻辑
+def load_kb():
+    if not os.path.exists("knowledge.txt"):
+        with open("knowledge.txt", "w", encoding="utf-8") as f:
+            f.write("私有大脑知识库已就绪。")
+    loader = TextLoader("knowledge.txt", encoding="utf-8")
+    docs = CharacterTextSplitter(chunk_size=500, chunk_overlap=50).split_documents(loader.load())
+    # 使用中文优化的 Embedding 模型
+    embeddings = HuggingFaceEmbeddings(model_name="BAAI/bge-small-zh-v1.5")
+    vectorstore = FAISS.from_documents(docs, embeddings)
+    return vectorstore
+# 初始化问答链
+vs = load_kb()
+# 注意：这里我们使用最新的 invoke 接口
 qa_chain = RetrievalQA.from_chain_type(
     llm=llm,
+    retriever=vs.as_retriever(search_kwargs={"k": 3})
 )
+# 3. 聊天处理函数
+def chat_fn(message, history):
     try:
+        # 使用 invoke 替代旧的直接调用，解决 InferenceClient 兼容性
+        result = qa_chain.invoke({"query": message})
+        return result["result"]
     except Exception as e:
+        # 如果 Token 权限有问题，给出清晰提示
+        if "401" in str(e):
+            return "错误：Token 无效或权限不足，请检查 Settings 里的 HF_TOKEN。"
+        return f"大脑响应异常：{str(e)}"
+# 4. 构建前端界面
 demo = gr.ChatInterface(
+    chat_fn,
+    title="全能私有大脑 v2.5",
+    description="针对最新 API 进行了深度优化，现在可以正常调取知识库了。"
 )
 if __name__ == "__main__":