ruSpamModels/russian-spam-detection
Viewer • Updated • 4.51M • 180 • 11
How to use ruSpamModels/ruSpam_big with Transformers:
# Use a pipeline as a high-level helper
from transformers import pipeline
pipe = pipeline("text-classification", model="ruSpamModels/ruSpam_big") # Load model directly
from transformers import AutoTokenizer, AutoModelForSequenceClassification
tokenizer = AutoTokenizer.from_pretrained("ruSpamModels/ruSpam_big")
model = AutoModelForSequenceClassification.from_pretrained("ruSpamModels/ruSpam_big")Модель ruSpam_big — нейросеть для определения спама в русскоязычных текстах. Обучена на почти 5 миллионах примеров, показывает высокую точность и устойчивость, но иногда может ошибаться на сообщениях с коммерческой тематикой.
import torch
from transformers import AutoTokenizer, AutoModelForSequenceClassification
device = torch.device("cuda" if torch.cuda.is_available() else "cpu")
tokenizer = AutoTokenizer.from_pretrained("ruSpamModels/ruSpam_big")
model = AutoModelForSequenceClassification.from_pretrained(
"NeuroSpaceX/ruSpam_big", num_labels=1
).to(device).eval()
text = "Пример сообщения"
encoding = tokenizer(text, padding="max_length", truncation=True, max_length=512, return_tensors="pt")
input_ids = encoding["input_ids"].to(device)
attention_mask = encoding["attention_mask"].to(device)
with torch.no_grad():
outputs = model(input_ids, attention_mask=attention_mask).logits
prediction = torch.sigmoid(outputs).cpu().numpy()[0][0]
is_spam = prediction >= 0.5
print(f"Результат: {'СПАМ' if is_spam else 'НЕ СПАМ'} (уверенность: {prediction:.4f})")
Если проект оказался полезен, вы можете поддержать его развитие:
TON:UQAvc2APxFcmNg0-K8TJ8ykdkl2GjwveuVfFd8-NOwHGEeqv
Рубли (Telegram):
Перейдите по старт-ссылке бота
👉 @ModProtectorBot
Спасибо за поддержку ❤️