빈도(Frequency) : 계절성 패턴(Seasonality)이 나타나기 전까지 데이터 개수로 사람이 정해야 함
# freq를 변경해줌, H : hour
# ffil : NaN일 경우 앞의 데이터로 채움
raw_all.asfreq('H', method='ffil')
ffill
, bfill
등으로 데이터 채움시계열 분해(추세/계절성/잔차(residual))
# sm : statsmodels.api
# additive로 시계열 분해 : 추세 + 계절성 + 잔차
# multiplicative도 있음 : 추세 * 계절성 * 잔차
sm.tas.seasonal_decompose(raw_all['count'], model='additive').plot()
더미 변수(dummy variable) : 이진수의 형태로 변수를 생성하는 것
시간변수 : 시간변수를 미시/거시적으로 분리/통합하여 생성된 변수
# 데이터를 앞뒤 24개로 묶어서 평균
raw_all[['count']].rolling(24).mean() # daily pattern
raw_all[['count']].rolling(24*7).mean() # weekly pattern
diff()
raw_all[['count']].diff()