Каталог курсов
Учиться бесплатно

Классификация

Классификация — это одна из задач машинного обучения, которая заключается в отнесении объекта к классу на основе его формализованных признаков.

Классификационные модели используются для автоматической обработки и анализа данных в любых сферах: медицинской диагностике, электронной коммерции, кибербезопасности и пр.

Суть этого метода состоит в предсказании дискретных значений: «да» или «нет», «белый» или «чёрный», «опасно» или «безопасно». Классификация может быть бинарной, когда таких классов два, и многоклассовой, когда их больше двух.

Классификация относится к обучению с учителем: для неё нужен набор с множеством записей, на которых можно учиться. С помощью набора тренировочных данных модель определит, как лучше сопоставить новые, входные данные с метками классов.

Примеры классификаций:
  1. Алгоритм обучается на наборе текстов с оценкой тональности и после анализирует новые тексты
  2. На основе данных пациентов с подтверждённым диагнозом алгоритм определяет диагноз новых пациентов
  3. Алгоритм классифицирует рукописный символ как цифру или букву
  4. По недавнему поведению алгоритм предсказывает, останется ли пользователь на сайте

Метки классов часто представлены в строковых значениях. Это значит, что до передачи в алгоритм моделирования каждой метке присваивается целое число: «Останется на сайте» — 1, «Не останется» — 0.

Узнайте больше в Медиа Нетологии:
Бесплатный курс по аналитике:
Программы обучения Нетологии по аналитике:
← В глоссарий
Вам может быть интересно
- 45%
Data Scientist
169 000
92 950
- 50%
Аналитик данных
177 200
88 600
Основы анализа данных в SQL, Python, Power BI, DataLens
0