Spaces:
Sleeping
Sleeping
| title: Тематический классификатор текста | |
| emoji: 🏷️ | |
| colorFrom: blue | |
| colorTo: purple | |
| sdk: gradio | |
| sdk_version: 6.5.1 | |
| app_file: app.py | |
| pinned: false | |
| # 🏷️ Тематический классификатор текста | |
| Веб-приложение для автоматической классификации текстов по темам с использованием нейронных сетей. Определяет основную тему текста из 12 возможных категорий. | |
| ## 🚀 Живая демонстрация | |
| [](https://huggingface.co/spaces/marry1908/Extracting-entities) | |
| ## 📌 Возможности приложения | |
| ### ✅ Основные функции | |
| - **Автоматическое определение** темы текста | |
| - **12 тематических категорий:** спорт, политика, наука и другие | |
| - **Визуализация результатов** с прогресс-барами | |
| - **История запросов** (последние 10 запросов) | |
| - **Настройка количества** отображаемых тем (1-5) | |
| - **Измерение времени** обработки | |
| - **Готовые примеры** для быстрого тестирования | |
| ### 🎯 Определяемые темы | |
| | Тема | Иконка | Описание | Пример текста | | |
| |------|--------|----------|---------------| | |
| | **Спорт** | 🏀 | Спортивные события, соревнования, команды | "Сборная России выиграла чемпионат мира по хоккею" | | |
| | **Политика** | 🏛️ | Политические новости, выборы, законы | "Парламент принял новый закон о налогах" | | |
| | **Наука** | 🔬 | Научные открытия, исследования, технологии | "Учёные открыли новый вид динозавров" | | |
| | **Технологии** | 💻 | IT, гаджеты, программы, интернет | "Apple представила новый iPhone 15" | | |
| | **Здоровье** | 🏥 | Медицина, болезни, лечение, ЗОЖ | "Врачи нашли новое лекарство от рака" | | |
| | **Образование** | 📚 | Школы, вузы, обучение, экзамены | "Министерство образования изменило правила ЕГЭ" | | |
| | **Культура** | 🎭 | Искусство, музыка, кино, литература | "В Эрмитаже открылась выставка Ван Гога" | | |
| | **Экономика** | 💰 | Финансы, бизнес, рынки, кризисы | "Цены на нефть выросли на 10%" | | |
| | **Путешествия** | ✈️ | Туризм, страны, достопримечательности | "Турция стала самым популярным курортом" | | |
| | **Развлечения** | 🎬 | Фильмы, сериалы, игры, шоу | "Вышел новый сезон Игры престолов" | | |
| | **Погода** | ☀️ | Климат, температура, природные явления | "Завтра ожидается снегопад и метель" | | |
| | **Происшествия** | 🚨 | Аварии, катастрофы, криминал | "В Москве произошло серьёзное ДТП" | | |
| ## 🧠 Используемая модель | |
| ### **Модель:** `facebook/bart-large-mnli` | |
| ### **Почему выбрана эта модель:** | |
| 1. **Zero-shot классификация** - не требует предварительного обучения на конкретных темах | |
| 2. **Мультиязычная поддержка** - работает с русским и английским языками | |
| 3. **Высокая точность** - показывает хорошие результаты на разнообразных текстах | |
| 4. **Гибкость** - можно легко добавлять новые темы без переобучения | |
| 5. **Оптимизирована для CPU** - достаточно быстрая для веб-приложения | |
| ### **Принцип работы:** | |
| Модель использует технику **zero-shot классификации**, что означает: | |
| - Не нужен предварительно размеченный датасет | |
| - Можно задавать любые темы на лету | |
| - Модель определяет, насколько текст соответствует каждой теме | |
| ## 📊 Примеры работы | |
| ### Пример 1: Спортивный текст | |
| **Входной текст:** |