Spaces:
Running
Running
metadata
title: LP출자 온톨로지 LLM 프로토타입
emoji: 📊
colorFrom: purple
colorTo: indigo
sdk: docker
app_port: 7860
pinned: false
license: mit
short_description: 온톨로지 기반 폐쇄망 RAG 시스템 (LP 출자 도메인)
LP출자 온톨로지 LLM 적용 프로토타입 테스트
사내 AI 경진대회 출품작 · 온톨로지 기반 폐쇄망 RAG 시스템.
구조
api/— FastAPI 백엔드 (rag_engine + KoSimCSE + 4구성 호출 + LLM 어댑터)web/— React + Vite 프론트엔드 (3탭: 설명/테스트/데이터 관리)code/—rag_engine.py·semantic_search.py·baseline_lib.py등 핵심 모듈 (active/code 사본)data/—investment_ontology_v1_10.ttl·regulations_chunks_v14.jsonl·alias·lookupassets/— paper_v5.pdf·노드 그래프 png 등 다운로드용 정적 자산Dockerfile— multi-stage (Node 빌드 → Python 런타임)
환경변수 (HF Space Secrets에 설정)
| Key | 설명 |
|---|---|
ANTHROPIC_API_KEY |
Sonnet 4.6 호출용 (필수) |
HF_TOKEN |
HF Inference API용 (Gemma 호출) |
LLM_BACKEND |
hf_inference 권장 (또는 ollama/transformers_local) |
HF_GEMMA_MODEL |
기본: google/gemma-4-E4B-it (Gemma 4 E4B, multimodal, 128K context) |
ANTHROPIC_MODEL |
기본: claude-sonnet-4-6 |
로컬 개발
# 백엔드
cd api && pip install -r requirements.txt
uvicorn main:app --reload --port 8000
# 프론트엔드 (별도 터미널)
cd web && npm install && npm run dev
# Vite dev 서버가 /api 호출을 :8000으로 프록시
핵심 결과 (페이퍼 기준)
- 패러프레이즈 정답률 (lenient): 키워드 33% → axisB (LLM파서+KoSimCSE) 93~100%
- Sonnet ≒ Gemma 4 e4b 패러프레이즈 lenient 동등 → 폐쇄망 4B 정당성 입증
- 30문항 × 8구성 × 3회 = 720 응답 + Sonnet judge 평가 (
results_v5_axisB/)