marry1908's picture
Update README.md
9229401 verified
---
title: Тематический классификатор текста
emoji: 🏷️
colorFrom: blue
colorTo: purple
sdk: gradio
sdk_version: 6.5.1
app_file: app.py
pinned: false
---
# 🏷️ Тематический классификатор текста
Веб-приложение для автоматической классификации текстов по темам с использованием нейронных сетей. Определяет основную тему текста из 12 возможных категорий.
## 🚀 Живая демонстрация
[![Open in Spaces](https://huggingface.co/datasets/huggingface/badges/raw/main/open-in-hf-spaces-sm-dark.svg)](https://huggingface.co/spaces/marry1908/Extracting-entities)
## 📌 Возможности приложения
### ✅ Основные функции
- **Автоматическое определение** темы текста
- **12 тематических категорий:** спорт, политика, наука и другие
- **Визуализация результатов** с прогресс-барами
- **История запросов** (последние 10 запросов)
- **Настройка количества** отображаемых тем (1-5)
- **Измерение времени** обработки
- **Готовые примеры** для быстрого тестирования
### 🎯 Определяемые темы
| Тема | Иконка | Описание | Пример текста |
|------|--------|----------|---------------|
| **Спорт** | 🏀 | Спортивные события, соревнования, команды | "Сборная России выиграла чемпионат мира по хоккею" |
| **Политика** | 🏛️ | Политические новости, выборы, законы | "Парламент принял новый закон о налогах" |
| **Наука** | 🔬 | Научные открытия, исследования, технологии | "Учёные открыли новый вид динозавров" |
| **Технологии** | 💻 | IT, гаджеты, программы, интернет | "Apple представила новый iPhone 15" |
| **Здоровье** | 🏥 | Медицина, болезни, лечение, ЗОЖ | "Врачи нашли новое лекарство от рака" |
| **Образование** | 📚 | Школы, вузы, обучение, экзамены | "Министерство образования изменило правила ЕГЭ" |
| **Культура** | 🎭 | Искусство, музыка, кино, литература | "В Эрмитаже открылась выставка Ван Гога" |
| **Экономика** | 💰 | Финансы, бизнес, рынки, кризисы | "Цены на нефть выросли на 10%" |
| **Путешествия** | ✈️ | Туризм, страны, достопримечательности | "Турция стала самым популярным курортом" |
| **Развлечения** | 🎬 | Фильмы, сериалы, игры, шоу | "Вышел новый сезон Игры престолов" |
| **Погода** | ☀️ | Климат, температура, природные явления | "Завтра ожидается снегопад и метель" |
| **Происшествия** | 🚨 | Аварии, катастрофы, криминал | "В Москве произошло серьёзное ДТП" |
## 🧠 Используемая модель
### **Модель:** `facebook/bart-large-mnli`
### **Почему выбрана эта модель:**
1. **Zero-shot классификация** - не требует предварительного обучения на конкретных темах
2. **Мультиязычная поддержка** - работает с русским и английским языками
3. **Высокая точность** - показывает хорошие результаты на разнообразных текстах
4. **Гибкость** - можно легко добавлять новые темы без переобучения
5. **Оптимизирована для CPU** - достаточно быстрая для веб-приложения
### **Принцип работы:**
Модель использует технику **zero-shot классификации**, что означает:
- Не нужен предварительно размеченный датасет
- Можно задавать любые темы на лету
- Модель определяет, насколько текст соответствует каждой теме
## 📊 Примеры работы
### Пример 1: Спортивный текст
**Входной текст:**