Статистика

сент.
26
Круговая диаграмма (Piechart)

Круговая диаграмма (Piechart)

Круговая диаграмма – это тип визуализации данных, который отображает данные в виде круговой диаграммы. Весь «пирог» представляет собой 100 процентов целого,
1 min read
сент.
26
Мультиколлинеарность (Multicollinearity)

Мультиколлинеарность (Multicollinearity)

Мультиколлинеарность – это наличие высокой взаимной корреляции между двумя или более независимыми переменными в модели Регрессии (Regression) [https://www.helenkapatsa.ru/
2 min read
сент.
26
Точка пересечения (Intercept)

Точка пересечения (Intercept)

Точка пересечения (B0) – константа уравнения Линейной регрессии (Linear Regression) [https://www.helenkapatsa.ru/linieinaia-rieghriessiia/], характеризующая сдвиг прямой относительно точки начала
1 min read
авг.
29
Метод локтя (Elbow Rule)

Метод локтя (Elbow Rule)

Метод локтя – один из самых известных методов, с помощью которого вы можете выбрать правильное значение k и повысить производительность Модели
2 min read
авг.
08
Альтернативная гипотеза (Alternative Hypothesis)

Альтернативная гипотеза (Alternative Hypothesis)

Альтернативная гипотеза – предположение, которое предстоит тестировать на истинность в рамках статистического анализа. Для наглядности ее, как правило, иллюстрируют примером в
1 min read
авг.
01
Гистограмма (Histogram)

Гистограмма (Histogram)

Гистограмма – популярный график, используемый во время Разведочного анализа данных (EDA) [https://www.helenkapatsa.ru/razvedochnyy-analiz-dannykh-chast-1/], а также на других стадиях
1 min read
июль
03
Эпсилон (Epsilon)

Эпсилон (Epsilon)

Эпсилон (ε, epsilon) – 1. (В статистике) Степень эффекта (Effect Size), используемая для сравнения. 2. (В Машинном обучении) порог некоторых классификаторов
1 min read
июнь
19
Правило большого пальца (Rule of Thumb)

Правило большого пальца (Rule of Thumb)

Правило большого пальца (эмпирическое правило диапазона) – это удобный метод оценки диапазона по Стандартному отклонению (Standard Deviation) [https://www.helenkapatsa.ru/
2 min read
июнь
11
Мода (Mode)

Мода (Mode)

Мода – это наиболее часто встречающееся в наборе данных значение. Признак (Feature) Датасета (Dataset) может иметь одну или более мод или
2 min read
май
31
Гомоскедастичность (Homoscedasticity)

Гомоскедастичность (Homoscedasticity)

Гомоскедастичность – допущение линейной регрессии об "одинаковости" Дисперсии (Variance) [https://www.helenkapatsa.ru/dispiersiia/]. Иными словами, разность между реальным Ypred и
4 min read