본문 바로가기
경제학/금융시계열분석

2 ~ 3주차 : 시계열 개념 review

by zzyunzz 2021. 9. 21.

0. 들어가기

- 횡단면분석에서의 데이터는 i.i.d(identical, independently distributed)를 가정했음
=> 한 시점에서 분석대상이 되는 개체들은 독립적으로 존재하여 상호 영향이 없다
=> 표본 분석을 통해 외부에 분석 결과를 적용하는 데에 무리가 없다.
- 대부분의 시계열데이터는 과거 데이터의 영향을 받을 수밖에 없기 때문에, i.i.d 가정을 충족할 수 없음. 따라서 시계열 분석을 위해 i.i.d 가정에 대응되는, 시계열 분석 결과의 외부 확장성을 위한 가정이 필요함.

1. 확률과정(stochastic process)와 안정성(stationarity)

1) 확률과정 : 확률변수의 시퀀스. 앙상블(ensemble)중 실현된 형태만을 묶어놓은 것
$$ {y_{t-1}, y_{t}, y_{t+1}...} $$
- 안정성 : 약안정성과 강안정성으로 다시 나뉨. 데이터의 외적 타당성(external validity)를 충족시켜주는 컨셉
2) - (1) 강안정성(strict stationarity) : 확률과정을 임의의 연속되는 s개의 인덱스로 이루어진 부분집합으로 나누었을 때, 어떻게 나누더라도 그 부분집합끼리의 결합확률분포(joint probability distribution)가 동일하다
$$ F(y_{t_2}, y_{t}, y_{t+1}) = F(y_{t+1}, y_{t+2}, y_{t+3}) $$
=> 확률 과정의 marginal distribution이 항상 일정함을 의미함. 즉 데이터 분포 자체의 stable함을 요구하는 아주 강한 가정
실제로는 이 가정을 만족하기 아주아주아주 어려우므로, 적당하게 완화할 필요가 있다. 그 가정이 약안정성

2) - (2) 약안정성(weak stationarity) : 아래의 세 조건을 만족하면 약안정성이 충족됨
$$ E[y_{t}] = \mu $$
$$ Var[y_{t}] = \sigma_{y}^2 $$
$$ Cov(y_{t}, y_{s}) = \gamma_{|t - s|} $$
=> 1차, 2차 모먼트와 공분산이 유한해야 함을 의미함.
a. 세 번째 조건은 약의존적인(weakly dependent) 확률과정의 분산값이 존재하는지와도 직결되므로 아주 중요한 가정
b. 강안정성과 약안정성은 한쪽이 다른 쪽을 포함하는 관계가 아니다
- 코시 분포(Cauchy distribution)의 경우 2차 중심 모먼트인 분산이 무한하기 때문에 약안정성 가정을 충족하지 못한다. 하지만 강안정성은 충족함
c. 분석 대상이 되는 데이터는 약안정성을 얼마나 충족할까
- 거시 데이터 : 조건 충족하는 경우가 거의 없음(gdp 데이터, 소비 데이터 등등). 따라서 필수적으로 데이터 처치 과정이 필요함
- 금융 데이터 : stylized fact가 대부분의 경우 stationary하게 나타남. 그리고 금융 데이터의 경우 안정성 충족을 하지 않는 것에 대해 크게 신경쓰지 않는다고 한다.

2. 자기공분산(autocovariance), 자기상관계수(autocoefficient)

1) 자기공분산 : 시차가 존재하는 두 관찰값 사이의 분산
약안정성을 충족하는 확률과정 y에 대하여
$$ \gamma_{h} = E[(y_{t}-\mu)(y_{t+h}-\mu)] $$
2) 자기상관계수 : 자기공분산을 분산으로 나누어준 값
$$ \rho_{h} = \frac{Cov(y_{t}, y_{t+h})}{Var(y)} = \frac{\gamma_{h}}{\sigma_{y}^2} $$

 

 

댓글