[시계열] 시계열 데이터의 특징들 -1. 자기상관성, 정상성, 등분산성
·
데이터 과학 Data Science/시계열 데이터
시계열 데이터라 함은 단순히 시간 순으로 나누어진 데이터다. 그런데, 시게열 데이터에는 계절성이라던가, 반복성, 순환성, 추세성 같은 특징들이 있다. 저런 특이한 성질들이나 추세 때문에 시계열 데이터에서는 저 성질을 제외하고 머신러닝에 넣어주는 작업이 굉장히 중요하다. 왜일까? 예를 들어 보겠다. 자 가장 쉬운 예시를 가져왔다. 다음은 우유 생산량으로 시계열 데이터의 계절성 (seasonality) 를 확인할 수 있는 그래프다. 부패하기 쉬운 여름에 생산량이 확 줄었다가 봄가을에 다시 많아지는 계절성을 보인다. 이런 데이터의 range 의 variousity 를 머신러닝에 집어넣으면 머신러닝은 이를 포착하지 못하기 때문에 어느정도의 bias 가 생기기 마련이다. 위 그래프는 전반적으로 우상향 그래프를 그..
허니비 honeybee
'데이터 과학 Data Science/시계열 데이터' 카테고리의 글 목록 (2 Page)