Archive/통계&코딩이것저것

계절 변동을 고려한: 시계열 회귀분석(2)

입짧은달님 2022. 5. 31. 18:42

https://www.youtube.com/watch?v=5QnR4L3KGz4&list=PLpIPLT0Pf7IqSuMx237SHRdLd5ZA4AQwd&index=7 

김성범 교수님 강의를 참고하였음!!

 

 

Modeling Seasonal Variations

Binary Variable Models

트랜드와 계절 변동과 오차로 이루어진 y

  • 계절 변수는 어떻게 표현해?
    • 이진 변수(0 or 1) 로 표현해!

  • 그래프를 그렸을 때 변동이 증가하고 있었기 때문에 y에 ln을 취함.(상수로 바꿔준다)
  • 12월은 굳이 더미로 만들 필요 없음(당연, 다 0이면 되니까)
  • 베타2는 기준인 12월과 비교했을때 얼마나 증가/감소 했느냐에 대한 값.

 

적합해 봄! 

  • time변수는 증가하는 trend임을 알 수 있음.
  • month beta 값들은? 12월에 비해 저만큼 증가하거나 감소함.

 

Trigonometric Models

  • 시즈널 변동을 sine과 cosine으로 표현해 보자는 idea!

model1: 심플한 계절 변동

model2: 복잡한 계절 변동

 

자세한 설명은 생략한다...

Growth Curve Models

파라미터가 곱하기로 연결되어있다! (비선형 결합)

-> linear 하게 바꿔주자 ㅎㅎ

로그를 취해주면 우리가 아는 회귀모델이랑 비슷하게 바뀐다
베타가 바뀜에 따라 이런 식으로 변함

 

Time Series Regression with Autocorrelation 

  • 선형회귀 모델의 error-term에서 서로 다른 시점에서 독립이어야 하는데, 시계열 데이터에서는 독립이 아닌 경우가 대부분.어떻게 모델을 세울 수 있을까?
  • 자기상관성은 잔차플롯이나 더빈 왓슨 테스트로 알 수 있음.

 

제일 위: error term 을 모델링 한 식

파이1: 한시점 전의 자기상관의 크기! 파이1이 양수면 양의 자기상관. 

 

이러면 최소제곱법으로 베타를 추정할 수가 없어!

 

예제로 한 번 보자.

이런 데이터가 있다. fconvict가 y임.

전형적인 ols를 이용한 회귀분석을 해보자. 

 

혹싀.... 자기상관이 있지 않을까? 하며 테스트를 해보기로 한다....

아니나다를까 첫번째 시차에서 자기상관이 검출되었다! 

 

시계열 회귀분석(ARMA)을 돌린 결과를 ols 회귀분석과 비교해본다. 

 

큰 차이는 없는데, 뭐가 차이가 있느냐? mconvict의 유의성이 다르다. 중요한 변수로 나타나게 됨. 

 

더 자세한 내용은 다음 시간에 알아보자!