AlexandreScriptsMT commited on
Commit
8636f0d
·
verified ·
1 Parent(s): ae9531b

Create Dockerfile

Browse files
Files changed (1) hide show
  1. Dockerfile +36 -0
Dockerfile ADDED
@@ -0,0 +1,36 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ # Use uma imagem Python leve
2
+ FROM python:3.10-slim
3
+
4
+ # Instalar dependências de build necessárias para compilar o llama-cpp
5
+ RUN apt-get update && apt-get install -y \
6
+ build-essential \
7
+ cmake \
8
+ python3-dev \
9
+ curl \
10
+ && rm -rf /var/lib/apt/lists/*
11
+
12
+ # Definir diretório de trabalho
13
+ WORKDIR /app
14
+
15
+ # Instalar llama-cpp-python otimizado para CPU
16
+ # Usamos flags para garantir que não tente usar CUDA (GPU)
17
+ RUN CMAKE_ARGS="-DLLAMA_BLAS=ON -DLLAMA_BLAS_VENDOR=OpenBLAS" \
18
+ pip install llama-cpp-python huggingface_hub[cli] gradio
19
+
20
+ # Criar pasta para o modelo
21
+ RUN mkdir -p /app/models
22
+
23
+ # Baixar o modelo Llama-3.1-8B-Instruct Q4_K_M durante o build
24
+ # Isso evita downloads demorados toda vez que o Space reiniciar
25
+ RUN huggingface-cli download bartowski/Meta-Llama-3.1-8B-Instruct-GGUF \
26
+ --include "Meta-Llama-3.1-8B-Instruct-Q4_K_M.gguf" \
27
+ --local-dir /app/models
28
+
29
+ # Copiar seu script de interface (app.py) para o container
30
+ COPY app.py .
31
+
32
+ # Hugging Face Spaces roda na porta 7860 por padrão
33
+ EXPOSE 7860
34
+
35
+ # Comando para rodar a aplicação
36
+ CMD ["python", "app.py"]