Вы подписаны на Машинное обучение доступно
Отлично! завершите оплату для полного доступа к Машинное обучение доступно
Снова приветствуем Вас! Вы успешно авторизовались
Успех! Аккаунт активирован, и Вы имеете полный доступ к контенту.
Дисперсия (Variance)

Дисперсия (Variance)

in

Дисперсия случайной величины (σ2, s2, Var(x)) – мера удаленности того или иного значения Выборки (Sample) от Среднего значения (Mean). Рассчитывается с помощью формулы:

$$σ^2 = \frac{Σ{(x_i - x̅)^2}}{N}, где$$
$$σ^2\space{–}\space{Дисперсия}\space{случайной}\space{величины,}$$
$$x_i\space{–}\space{i-й}\space{элемент}\space{выборки,}$$
$$x̅\space{–}\space{среднее}\space{арифметическое,}$$
$$N\space{–}\space{количество}\space{элементов}\space{выборки}$$

Пример. Друзья измерили рост своих собак разных пород и хотят выяснить, у скольких собак слишком большой и слишком маленький рост.

Для начала найдем среднее арифметическое:

$$σ^2 = \frac{600 + 470 + 170 + 430 + 300}{5} = \frac{1970}{5} = 394$$

Теперь, с добавлением среднего, восприятие точек немного изменится:

Чтобы вычислить дисперсию, выясним разность между каждым элементом выборки и средним значением:

Выполнив подстановку, мы получим значение дисперсии – 21 тысячу:

$$σ^2 = \frac{206^2 + 76^2 + (-224)^2 + 36^2 + (-94)^2}{5} = \frac{108520}{5} = 21704$$

Чтобы решить основную задачу, извлечем из этой цифры квадратный корень и получим тем самым Стандартное отклонение (Standard Deviation):

$$σ = \sqrt{21704} ≈ 147,32,\space{где}$$
$$σ\space{–}\space{стандартное}\space{отклонение}$$

Теперь мы знаем, какое отклонение от среднего значения является нормой, а какое – нет:

Выходит, что из всей выборки очень высоким и очень низким ростом обладают две собаки.

Фото: @aaronphs