Multiple Linear Regression
- 여러 개의 독립 변수를 사용하여 종속 변수의 값을 예측하는 방법
Single Linear Regression이 종속 변수를 추정하기 위해 한 개의 독립 변수를 사용하는 반면, 다중 선형 회귀분석은 여러 개의 독립 변수를 사용하여 종속 변수의 값을 예측합니다.
-
여러 독립 변수: 다중 선형 회귀분석에서는 종속 변수의 값이 여러 독립 변수에 의해 영향을 받습니다.
- 예를 들어, CO2 배출량을 예측하는 데에는 엔진 크기, 실린더 수, 연료 소비량 등이 모두 역할을 합니다.
-
최적화된 파라미터: 최적화된 파라미터란 모델의 오류가 가장 적은 파라미터를 의미합니다.
- 이러한 파라미터는 예측의 오류를 최소화함으로써 찾아집니다.
- 이 파라미터를 추정하는 방법에는 최소제곱법과 경사 하강법과 같은 최적화 알고리즘이 있습니다.
-
오류 측정
- 다중 선형 회귀분석은 모델의 예측에서 오류를 측정하기 위해 평균 제곱 오차 (Mean Squared Error, MSE)를 사용합니다.
- MSE를 최소화하는 것은 최적화된 파라미터를 결정하는 데 도움이 됩니다.
-
예측: 파라미터가 결정되면, 특정 입력 세트에 대해 선형 방정식을 풀어 예측을 만들 수 있습니다.
응용
다중 선형 회귀분석은 두 가지 주요 응용이 있습니다:
-
효과 식별
- 독립 변수가 종속 변수에 미치는 영향의 강도를 확인하려는 경우에 사용됩니다.
- 예를 들어, 학습 시간, 시험 불안, 강의 출석, 성별 등이 학생들의 시험 성적에 어떤 영향을 미치는지 확인하는 것입니다.
-
영향 예측
- 독립 변수를 변경할 때 종속 변수가 어떻게 변하는지 이해하는 데 사용됩니다.
- 예를 들어, 개인의 건강 데이터를 검토하는 경우, 다른 요인을 고정한 상태에서 체질량 지수가 한 단위 증가하거나 감소할 때 사람의 혈압이 어떻게 변하는지 예측하는 것입니다.
요약
다중 선형 회귀분석의 목표는 가장 적은 예측 오류를 가져오는 데이터에 대한 최적의 해를 찾는 것입니다.
선형 방정식의 파라미터를 찾은 후, 특정 입력 세트에 대한 방정식을 풀면 예측을 쉽게 할 수 있습니다.
그러나 일반적으로 마주치는 도전 과제는 모델에 사용해야 하는 독립 변수의 수를 결정하는 것입니다.
더 많은 변수를 사용하면 항상 모델의 정확도가 높아지는 것은 아닙니다.
부족한 점이나 잘못 된 점을 알려주시면 시정하겠습니다 :>
'AI' 카테고리의 다른 글
Non-Linear Regression (0) | 2023.07.06 |
---|---|
Multiple Linear Regression 실습 (0) | 2023.07.06 |
Simple Linear Regression 실습 (0) | 2023.07.05 |
회귀 모델에서의 손실 함수 (0) | 2023.07.05 |
Model Evaluation in Regression Models (0) | 2023.07.05 |