1 min read

Полярность (Polarity)

Полярность (Polarity)
Фото: Kurt Cotoaga / Unsplash

Полярность – характеристика текстового Признака (Feature) Датасета (Dataset), описывающая эмоциональную окраску (отрицательная или положительная). К примеру, мы располагаем датасетом комментариев YouTube и хотим оценить, понравилось ли в целом пользователям видео или нет. Для этого каждому комментарию присваивается оценка в диапазоне [-1, 1], где '-1' соответствует отрицательной окраске текста, и в конечном итоге рассчитывается среднее значение полярности – некая итоговая оценка зрителей.

Полярность: textblob

Посмотрим, как работает автоматическая разметка текста в textblob. Для начала импортируем необходимые библиотеки:

!pip install textblob
import pandas as pd
from textblob import TextBlob

Теперь мы можем оценивать эмоциональную окраску любого комментария с помощью sentiment.polarity:

print(TextBlob('It\'s more accurate to call it the M+ (1000) be..').sentiment.polarity)
print(TextBlob('Power is the disease.  Care is the cure.  Keep..').sentiment.polarity)

Первый комментарий система оценила как в целом положительный, второй – как нейтральный:

>>>
0.45000000000000007
0.0

Ноутбук, не требующий дополнительной настройки на момент написания статьи, можно скачать здесь.

Автор оригинальной статьи: Breyanne Broughton