Spaces:
Sleeping
Sleeping
A newer version of the Gradio SDK is available:
6.9.0
metadata
title: Тематический классификатор текста
emoji: 🏷️
colorFrom: blue
colorTo: purple
sdk: gradio
sdk_version: 6.5.1
app_file: app.py
pinned: false
🏷️ Тематический классификатор текста
Веб-приложение для автоматической классификации текстов по темам с использованием нейронных сетей. Определяет основную тему текста из 12 возможных категорий.
🚀 Живая демонстрация
📌 Возможности приложения
✅ Основные функции
- Автоматическое определение темы текста
- 12 тематических категорий: спорт, политика, наука и другие
- Визуализация результатов с прогресс-барами
- История запросов (последние 10 запросов)
- Настройка количества отображаемых тем (1-5)
- Измерение времени обработки
- Готовые примеры для быстрого тестирования
🎯 Определяемые темы
| Тема | Иконка | Описание | Пример текста |
|---|---|---|---|
| Спорт | 🏀 | Спортивные события, соревнования, команды | "Сборная России выиграла чемпионат мира по хоккею" |
| Политика | 🏛️ | Политические новости, выборы, законы | "Парламент принял новый закон о налогах" |
| Наука | 🔬 | Научные открытия, исследования, технологии | "Учёные открыли новый вид динозавров" |
| Технологии | 💻 | IT, гаджеты, программы, интернет | "Apple представила новый iPhone 15" |
| Здоровье | 🏥 | Медицина, болезни, лечение, ЗОЖ | "Врачи нашли новое лекарство от рака" |
| Образование | 📚 | Школы, вузы, обучение, экзамены | "Министерство образования изменило правила ЕГЭ" |
| Культура | 🎭 | Искусство, музыка, кино, литература | "В Эрмитаже открылась выставка Ван Гога" |
| Экономика | 💰 | Финансы, бизнес, рынки, кризисы | "Цены на нефть выросли на 10%" |
| Путешествия | ✈️ | Туризм, страны, достопримечательности | "Турция стала самым популярным курортом" |
| Развлечения | 🎬 | Фильмы, сериалы, игры, шоу | "Вышел новый сезон Игры престолов" |
| Погода | ☀️ | Климат, температура, природные явления | "Завтра ожидается снегопад и метель" |
| Происшествия | 🚨 | Аварии, катастрофы, криминал | "В Москве произошло серьёзное ДТП" |
🧠 Используемая модель
Модель: facebook/bart-large-mnli
Почему выбрана эта модель:
- Zero-shot классификация - не требует предварительного обучения на конкретных темах
- Мультиязычная поддержка - работает с русским и английским языками
- Высокая точность - показывает хорошие результаты на разнообразных текстах
- Гибкость - можно легко добавлять новые темы без переобучения
- Оптимизирована для CPU - достаточно быстрая для веб-приложения
Принцип работы:
Модель использует технику zero-shot классификации, что означает:
- Не нужен предварительно размеченный датасет
- Можно задавать любые темы на лету
- Модель определяет, насколько текст соответствует каждой теме
📊 Примеры работы
Пример 1: Спортивный текст
Входной текст: