기계컴퓨터가 잘하는 능력은 예측하기, 기계가 스스로 학습해 만드는 예측모델은 정확할까 ? - joungna님의 블로그 - 인프런

인공지능이라고 해도 실제로는 미래의 주가 등 미래에 일어날 사건을 예측하는 것은 거의 어렵다. 점쟁이도 어려운 일이다. 다만, 데이터들의 관계로 부터 추정된 평균적인 예측, 즉 비가 올지 안올지 예측분류하거나, 특정한 시점의 데이터의 평균치를 예측하거나 미래의 추세를 판단하는 것은 가능하다. 왜냐하면 통계적으로 데이터들은 평균을 향하여 움직이거나 회귀(regression)하는 경향이 있기 때문에 평균적인 값으로 예측하는 것은 확률적으로 발생할 가능성이 높기 때문이다.

예측 한다는 의미는 무엇일까? 예측의 개념을 크게 두가지로 분류해보면 prediction과 forecasting으로 나눌수 있다. 예측 forecasting은 시계열에서(in time series)의 예측으로 날씨 ,지진 예측 등 시계열의 과거자료를 바탕으로 미래 값을 추정하는 것이며, 예측 prediction은 회귀에서(in regression)의 예측으로 비즈니스, 경제예측 등 판단 적이며 미래에 발생하는 변화를 고려하여, 주어진 데이터에 대해 미래, 현재 또는 과거에 빈곳의 값을 추정하는 것을 의미한다.

즉, "예측forecast"은 시계열과 미래를 의미하지만 "예측prediction"은 회귀를 사용하여 두 변수 간의 관계를 설명하는 것이다. 앞에서 시계열로 예측을 한다(making a forecast)는 방법을 학습하고, 이번장에서는 회귀모델로 예측을한다(making a forecast)는 방법을 학습한다.

회귀분석모델의 유형분류는 우선 선형관계분석이냐 비선형관계분석이냐 여부에 따라 전통적인 방식과 최근 딥러닝방식으로 구분된다. 회귀모델의 선형관계와 비선형관계를 구분할때 선형이냐 비선형이냐를 결정하는 대상은 ‘변수’인 독립변수나 종속변수의 관계가 아니라 ‘회귀 계수’간의 선형결합여부 등 관계로부터 선형성을 판단한다. 다음으로 분류기준은 종속변수의 변수 숫자와 독립변수의 숫자에 따라 구분한다.