1 min read

Категориальная переменная (Categorical Variable)

Категориальная переменная (Categorical Variable)

Категориальная (номинальная) переменная – это переменная, которая состоит из Ярлыков (Label), и количество возможных значений часто ограничено.

Пример. Банк собирает данные о своих клиентах с целью определить, кто готов приобрести кредитный продукт. Для этого проводится анкетирование, с помощью которого выясняется:

  • Образование индивида: законченное школьное образование, бакалавриат и проч.
  • День звонка: понедельник, вторник и проч.
Датасет банка: "Семейное положение" и "Образование" – категориальные переменные

Некоторые категории вроде "день звонка" имеют естественные взаимосвязи своих значений, например, порядок дней недели.

Стоит отметить, что если значения переменной являются ограниченным набором чисел (например, возраст), то это не категориальная, а дискретная числовая переменная.

Если же мы имеем дело с логическим типом значений (да / нет), как столбец (workinkday) в примере ниже, то ее относят к бинарным категориальным переменным.

Фото: @v2osk