Классификация
Классификация — это одна из задач машинного обучения, которая заключается в отнесении объекта к классу на основе его формализованных признаков.
Классификационные модели используются для автоматической обработки и анализа данных в любых сферах: медицинской диагностике, электронной коммерции, кибербезопасности и пр.
Суть этого метода состоит в предсказании дискретных значений: «да» или «нет», «белый» или «чёрный», «опасно» или «безопасно». Классификация может быть бинарной, когда таких классов два, и многоклассовой, когда их больше двух.
Классификация относится к обучению с учителем: для неё нужен набор с множеством записей, на которых можно учиться. С помощью набора тренировочных данных модель определит, как лучше сопоставить новые, входные данные с метками классов.
Примеры классификаций:
- Алгоритм обучается на наборе текстов с оценкой тональности и после анализирует новые тексты
- На основе данных пациентов с подтверждённым диагнозом алгоритм определяет диагноз новых пациентов
- Алгоритм классифицирует рукописный символ как цифру или букву
- По недавнему поведению алгоритм предсказывает, останется ли пользователь на сайте
Метки классов часто представлены в строковых значениях. Это значит, что до передачи в алгоритм моделирования каждой метке присваивается целое число: «Останется на сайте» — 1, «Не останется» — 0.
Узнайте больше в Медиа Нетологии:
Бесплатный курс по аналитике:
Программы обучения Нетологии по аналитике: