본문 바로가기

data science5

Dynamic Time Warping (DTW) Dynamic Time Warping (DTW)란? - 시계열 분석에서 DTW는 속도가 다를 수 있는 두 시간 시퀀스 사이의 유사성을 측정하기 위한 알고리즘 중 하나입니다. DTW는 비디오, 오디오 및 그래픽 데이터의 시간적 시퀀스에 적용되었으며 실제로 선형 시퀀스로 변환될 수 있는 모든 데이터는 DTW로 분석할 수 있습니다. 예를들어 아래와 같은 데이터가 있다고 생각해 보겠습니다. a1 = [7,9,6,9,12,6,4,6,8] a2 = [1,1,7,9,6,9,12,6,4] x = [x for x in range(1,10)] plt.plot(x,a1) plt.plot(x,a2) plt.show() 두 데이터는 유사한 패턴을 가지지만 두 데이터의 유사도를 각각의 포인트의 점들로 계산을 한다면 유사도는 그렇.. 2022. 3. 2.
시계열 분석에서 예측 모델의 구축 및 Stacking을 위한 베이지안 회귀 분석 방법 (2/2) - 구현 먼저 데이터를 불러온 후 null 값을 처리하고 시각화 해보았습니다. (데이터: https://www.kaggle.com/c/rossmann-store-sales) import pandas as pd import numpy as np store = pd.read_csv("../rossmann-store-sales/store.csv") train = pd.read_csv("../rossmann-store-sales/train.csv") test = pd.read_csv("../rossmann-store-sales/test.csv") store.isnull().sum() store.fillna(0, inplace=True) train.isnull().sum() test.fillna(0, inplace=Tru.. 2022. 2. 28.
Data Science 인터뷰 질문 및 답변 (작성중) Data scientist 를 준비하면서 직접 받았던 인터뷰 질문이나, 인터넷에서 찾을 수 있는 질문들을 모아서 꾸준히 답안지를 작성해 보려합니다. 잘못된 정보가 있거나 필요한 질문이 있으면 편하게 알려주세요. 질문출처:https://zzsza.github.io/data/2018/02/17/datascience-interivew-questions/#contents https://www.simplilearn.com/tutorials/data-science-tutorial/data-science-interview-questions Top 50 Data Science Interview Questions and Answers 2022 | Simplilearn Uncover the top Data Science .. 2022. 1. 3.
Granger's Causality Test Granger's Causality란? - 1969년에 처음 발명된 통계기법으로 시계열 데이터 x 가 얼마나 y에 영향을 끼치는지 알아볼 수 있는 Test이다. Null Hypothesis = x does not Granger-cause y P-value가 0.05 보다 낮다면 Null hypothesis 를 reject 할 수 있으며, 곧 x가 y에게 유의미하게 영향을 끼쳤단 뜻이다. 1. Hang Seng 2. Kospi 3. S&P 500 4. Shanghai Composite 먼저 필요한 라이브러리를 import 해준다 import numpy as np import pandas as pd from statsmodels.tsa.stattools import grangercausalitytests 새.. 2021. 8. 18.
반응형