Mean squared error, MSE, cреднеквадратичная ошибка
Mean squared error, MSE, cреднеквадратичная ошибка — одна из метрик, с помощью которых в машинном обучении оценивают качество модели. Представляет собой среднее арифметическое квадратов разностей между фактическими и прогнозируемыми значениями.
MSE применяют, когда нужно выбрать модель, которая даёт меньше больши́х ошибок. Грубые ошибки становятся более заметными благодаря тому, что ошибка прогноза возводится в квадрат. Чем меньше значение MSE — тем меньше грубых ошибок даёт модель.
Как вычисляется mean squared error:
- для каждого наблюдения в данных рассчитывается разность между реальным значением и значением, предсказанным моделью
- разности возводятся в квадрат
- квадраты отклонений складываются, затем полученная сумма делится на количество наблюдений
Плюс MSE в том, что это чёткий количественный показатель, с помощью которого можно оценить качество работы модели на данных и сравнить качество разных предиктивных моделей.
Минус в том, что этот вид оценки неустойчив к выбросам в данных и в некоторых случаях может приводить к некорректным выводам.
Узнайте больше в Медиа Нетологии:
Бесплатный курс по аналитике и data science:
Программы обучения Нетологии по data science и машинному обучению: