marry1908's picture
Update README.md
9229401 verified

A newer version of the Gradio SDK is available: 6.9.0

Upgrade
metadata
title: Тематический классификатор текста
emoji: 🏷️
colorFrom: blue
colorTo: purple
sdk: gradio
sdk_version: 6.5.1
app_file: app.py
pinned: false

🏷️ Тематический классификатор текста

Веб-приложение для автоматической классификации текстов по темам с использованием нейронных сетей. Определяет основную тему текста из 12 возможных категорий.

🚀 Живая демонстрация

Open in Spaces

📌 Возможности приложения

✅ Основные функции

  • Автоматическое определение темы текста
  • 12 тематических категорий: спорт, политика, наука и другие
  • Визуализация результатов с прогресс-барами
  • История запросов (последние 10 запросов)
  • Настройка количества отображаемых тем (1-5)
  • Измерение времени обработки
  • Готовые примеры для быстрого тестирования

🎯 Определяемые темы

Тема Иконка Описание Пример текста
Спорт 🏀 Спортивные события, соревнования, команды "Сборная России выиграла чемпионат мира по хоккею"
Политика 🏛️ Политические новости, выборы, законы "Парламент принял новый закон о налогах"
Наука 🔬 Научные открытия, исследования, технологии "Учёные открыли новый вид динозавров"
Технологии 💻 IT, гаджеты, программы, интернет "Apple представила новый iPhone 15"
Здоровье 🏥 Медицина, болезни, лечение, ЗОЖ "Врачи нашли новое лекарство от рака"
Образование 📚 Школы, вузы, обучение, экзамены "Министерство образования изменило правила ЕГЭ"
Культура 🎭 Искусство, музыка, кино, литература "В Эрмитаже открылась выставка Ван Гога"
Экономика 💰 Финансы, бизнес, рынки, кризисы "Цены на нефть выросли на 10%"
Путешествия ✈️ Туризм, страны, достопримечательности "Турция стала самым популярным курортом"
Развлечения 🎬 Фильмы, сериалы, игры, шоу "Вышел новый сезон Игры престолов"
Погода ☀️ Климат, температура, природные явления "Завтра ожидается снегопад и метель"
Происшествия 🚨 Аварии, катастрофы, криминал "В Москве произошло серьёзное ДТП"

🧠 Используемая модель

Модель: facebook/bart-large-mnli

Почему выбрана эта модель:

  1. Zero-shot классификация - не требует предварительного обучения на конкретных темах
  2. Мультиязычная поддержка - работает с русским и английским языками
  3. Высокая точность - показывает хорошие результаты на разнообразных текстах
  4. Гибкость - можно легко добавлять новые темы без переобучения
  5. Оптимизирована для CPU - достаточно быстрая для веб-приложения

Принцип работы:

Модель использует технику zero-shot классификации, что означает:

  • Не нужен предварительно размеченный датасет
  • Можно задавать любые темы на лету
  • Модель определяет, насколько текст соответствует каждой теме

📊 Примеры работы

Пример 1: Спортивный текст

Входной текст: