Идея линейной регрессии восходит к работам выдающихся математиков и статистиков XIX века:
Карл Гаусс (1809) — разработал метод наименьших квадратов для предсказания орбиты небесных тел.
Адриен-Мари Лежандр (1805) — независимо предложил метод наименьших квадратов.
Фрэнсис Гальтон (1886) — ввел термин "регрессия" при изучении связи между ростом родителей и детей, заметив, что рост детей "регрессирует" к среднему значению.
В XX веке линейная регрессия стала стандартным инструментом в статистике благодаря работам Рональда Фишера и других ученых.
Модели линейной регрессии относительно просты и предоставляют простую для интерпретации математическую формулу, которая может генерировать прогнозы. Линейная регрессия может применяться в различных областях бизнеса и академических исследований.
Линейная регрессия моделирует зависимость между переменными в виде линейного уравнения:
y=β0+β1x1+β2x2+⋯+βnxn+εy=β0+β1x1+β2x2+⋯+βnxn+ε
где:
yy — зависимая переменная (целевое значение),
x1,x2,…,xnx1,x2,…,xn — независимые переменные (признаки),
β0β0 — свободный член (интерсепт),
β1,β2,…,βnβ1,β2,…,βn — коэффициенты регрессии,
εε — ошибка (шум).
Основные предположения:
Линейность связи между переменными.
Отсутствие мультиколлинеарности (сильной корреляции между признаками).
Нормальное распределение ошибок.
Гомоскедастичность (постоянная дисперсия ошибок).
Метод наименьших квадратов (МНК) — стандартный способ нахождения коэффициентов, минимизирующий сумму квадратов ошибок.
Линейная регрессия широко используется в различных областях:
Экономика и финансы
Прогнозирование цен на акции, спроса на товары.
Оценка влияния факторов на ВВП, инфляцию.
Маркетинг
Анализ эффективности рекламных кампаний.
Прогнозирование продаж.
Медицина и биология
Исследование зависимости уровня заболеваемости от факторов среды.
Анализ эффективности лекарств.
Техника и производство
Оптимизация параметров производственных процессов.
Прогнозирование износа оборудования.
Машинное обучение
Базовый алгоритм для более сложных моделей (ридж-регрессия, лассо).
Используется в feature importance-анализе.