Полярность (Polarity)
Полярность – характеристика текстового Признака (Feature) Датасета (Dataset), описывающая эмоциональную окраску (отрицательная или положительная). К примеру, мы располагаем датасетом комментариев YouTube и хотим оценить, понравилось ли в целом пользователям видео или нет. Для этого каждому комментарию присваивается оценка в диапазоне [-1, 1], где '-1' соответствует отрицательной окраске текста, и в конечном итоге рассчитывается среднее значение полярности – некая итоговая оценка зрителей.
Полярность: textblob
Посмотрим, как работает автоматическая разметка текста в textblob. Для начала импортируем необходимые библиотеки:
!pip install textblob
import pandas as pd
from textblob import TextBlob
Теперь мы можем оценивать эмоциональную окраску любого комментария с помощью sentiment.polarity
:
print(TextBlob('It\'s more accurate to call it the M+ (1000) be..').sentiment.polarity)
print(TextBlob('Power is the disease. Care is the cure. Keep..').sentiment.polarity)
Первый комментарий система оценила как в целом положительный, второй – как нейтральный:
>>>
0.45000000000000007
0.0
Ноутбук, не требующий дополнительной настройки на момент написания статьи, можно скачать здесь.
Автор оригинальной статьи: Breyanne Broughton