-
서문
시계열 분석은 내재적인 불확실성 때문에 다소 어려운 측면이 있다고 생각합니다. 즉, 통계적 변수 때문에 시계열의 결과가 정해지는지, 아니면 심리적 요인과 같은 정성적인 변수때문에 결과값이 정해지는지가 말입니다. 또는, 두 가지 변수가 모두 영향을 줄 수도 있구요.
Stephen Frys는 다음과 같이 말했습니다.
"과거를 이해하지 않고, 어떻게 현재와 미래를 이해할 수 있는가?
본론
시계열 분석을 통해?
-> 기업이 현재 가지고 있는 고객, 매출, 다양한 데이터들을 활용할 때, 과거의 흔적들을 기반으로 미래의 가치를 예측하거나 계산할 때 사용된다.
-> 기업은 달별, 분기별, 매년 재고를 예측하여서 관리하여 예산 절약을 할 수 있다. 또한, 생존/이탈 유저를 분석하여서 프로모션 전략에서 타겟팅 등의 전략을 기획할 때 하나의 참고자료로써 활용될 수 있다.
시계열 분석의 4가지 타입
1. 트렌드(Trend): 데이터의 증가/감소 추이를 분석 -> 선형 OR 비선형
2.계절성(Seasonality): 특정 기간이 지난 후, 예상이 되거나 정기적으로 발생하는 시계열 상의 특징
3.순환/주기성(Cyclic): 데이터의 증가와 감소 추이가 일정한 패턴을 보임
4.변칙성(irregularity): 위의 트렌드, 계절성, 순환/주기성을 제하고, 시계열의 잔여분에서 보이는 특징
시계열 분석의 대표적인 예시 <FBProphet>
FBProphet은 페이스북이 만든 오픈소스이고, 시계열 분석을 좀 더 쉽게 사용할 수 있는 패키지이다.
이 모델은 3가지의 주요 변수들을 활용한 모델이다.
f(t) = g(t) + s(t) + h(t) + e(t)
g(t): 전반적인 성장 트렌드
s(t): 년도별 계절성, 주별 계절성
h(t): holiday effects
Seasonal, Trends, Holidays/events effect, error
데이터의 특징에 따라 선형/비선형 모델을 동시에 고려하면서 적재적소에 활용이 된다.
충족해야할 조건
1. 몇 달 동안의 시간, 일별, 주별의 데이터, 그리고 1년 이상의 데이터이면 더 좋다.
2. 강한 계절성을 띈다.
3. 중요한 이벤트가 holiday 발생은 반드시 기록해야 한다.
4. null값이나 아웃라이어가 적정수준을 넘으면 안된다.
5. Historical한 trend의 변화를 보인다.
FBProphet설치 방법
1 . 터미널에 pip intall pystan하고
2. 터미널에 pip intall fbprophet을 사용하면 된다.
유용한 prophet함수들
- Prophet.fit
- Prophet.predict
- Prophet.plot
- Prophet.plot_components
- Prophet.add_seasonality
- Prophet.add_regressors
- Prophet.seasonalities
- Prophet.predictive_samples
'데이터 분석 공부' 카테고리의 다른 글
프로그래머스, 스킬 트리, skill tree with python (0) 2021.01.19 생존분석(카플란 마이어, Kaplan-Meier Estimation) (0) 2021.01.16 시장 점유율 분석&사업/기업 성장률 분석 (0) 2021.01.08 목표 시장 크기 계산을 위한 데이터 활용&데이터 분석이 간략하게 무엇인가? (0) 2021.01.08 캐시노트 서비스 분석 (0) 2020.12.14