ABOUT ME

-

Today
-
Yesterday
-
Total
-
  • 시계열 분석
    데이터 분석 공부 2021. 1. 13. 10:47

    서문

     

    시계열 분석은 내재적인 불확실성 때문에 다소 어려운 측면이 있다고 생각합니다. 즉, 통계적 변수 때문에 시계열의 결과가 정해지는지, 아니면 심리적 요인과 같은 정성적인 변수때문에 결과값이 정해지는지가 말입니다. 또는, 두 가지 변수가 모두 영향을 줄 수도 있구요.

     

    Stephen Frys는 다음과 같이 말했습니다. 

    "과거를 이해하지 않고, 어떻게 현재와 미래를 이해할 수 있는가?

     

    본론

    시계열 분석을 통해?

    -> 기업이 현재 가지고 있는 고객, 매출, 다양한 데이터들을 활용할 때, 과거의 흔적들을 기반으로 미래의 가치를 예측하거나 계산할 때 사용된다.

    -> 기업은 달별, 분기별, 매년 재고를 예측하여서 관리하여 예산 절약을 할 수 있다. 또한, 생존/이탈 유저를 분석하여서 프로모션 전략에서 타겟팅 등의 전략을 기획할 때 하나의 참고자료로써 활용될 수 있다.

     

    시계열 분석의 4가지 타입

    1. 트렌드(Trend): 데이터의 증가/감소 추이를 분석 -> 선형 OR 비선형

    2.계절성(Seasonality): 특정 기간이 지난 후, 예상이 되거나 정기적으로 발생하는 시계열 상의 특징

    3.순환/주기성(Cyclic): 데이터의 증가와 감소 추이가 일정한 패턴을 보임

    4.변칙성(irregularity): 위의 트렌드, 계절성, 순환/주기성을 제하고, 시계열의 잔여분에서 보이는 특징

     

    시계열 분석의 대표적인 예시 <FBProphet>

    FBProphet은 페이스북이 만든 오픈소스이고, 시계열 분석을 좀 더 쉽게 사용할 수 있는 패키지이다.

    이 모델은 3가지의 주요 변수들을 활용한 모델이다.

    f(t) = g(t) + s(t) + h(t) + e(t)

    g(t): 전반적인 성장 트렌드

    s(t): 년도별 계절성, 주별 계절성

    h(t): holiday effects

    Seasonal, Trends, Holidays/events effect, error

    데이터의 특징에 따라 선형/비선형 모델을 동시에 고려하면서 적재적소에 활용이 된다.

     

    충족해야할 조건

    1. 몇 달 동안의 시간, 일별, 주별의 데이터, 그리고 1년 이상의 데이터이면 더 좋다.

    2. 강한 계절성을 띈다.

    3. 중요한 이벤트가 holiday 발생은 반드시 기록해야 한다.

    4. null값이나 아웃라이어가 적정수준을 넘으면 안된다.

    5. Historical한 trend의 변화를 보인다.

     

    FBProphet설치 방법

    1 . 터미널에 pip intall pystan하고

    2. 터미널에 pip intall fbprophet을 사용하면 된다. 

     

    유용한 prophet함수들

    1. Prophet.fit
    2. Prophet.predict
    3. Prophet.plot
    4. Prophet.plot_components
    5. Prophet.add_seasonality
    6. Prophet.add_regressors
    7. Prophet.seasonalities
    8. Prophet.predictive_samples

Designed by Tistory.