Признаки объекта, фичи
Признаки объекта, фичи (от англ. feature) — это переменные, которые описывают отдельно измеримые свойства или характеристики явления, объекта.
Такие элементы используются в моделях машинного обучения для точных предсказаний. Например, если модель определяет стоимость автомобиля, признаками будут год его выпуска, марка, количество владельцев и общее состояние.
Признаки могут извлекаться из данных любого типа:
- числовых
- категориальных, или качественных — бинарных вроде «да/нет», множественных, как цвета, и порядковых, как уровни образования или классы в школе
- временны́х
- текстовых
Чтобы сделать входную информацию для модели более структурированной, аналитики выполняют генерацию признаков. Этот процесс включает три действия:
- Извлечение признаков — превращение данных в понятные для модели символы
- Преобразование данных — их изменение для повышения точности алгоритма
- Отбор признаков — отсечение ненужных, неважных фич
Узнайте больше в Медиа Нетологии:
Бесплатный курс по аналитике:
Программы обучения Нетологии по аналитике: