본문 바로가기

2. Data Science Basics15

Dynamic Time Warping을 이용하여 비슷한 주식 clustering 하기 시계열 데이터를 공부하다 보면 비슷하게 움직이거나 서로 관련이 있는 데이터들을 종종 볼 수가 있습니다. 예를 들어 주식시장 데이터에 빗대어 설명해 보면, 전염병에 민감한 주식인 항공주들 같은 경우 코로나 발생이후 급격히 떨어졌으며 계속 서로 비슷하게 움직이는걸 확인할 수 있습니다. 위 그래프는 미국의 대표 한공사인 American Airline 과 Delta Airline의 그래프입니다. 상당히 비슷하게 움직이는 것을 확인할 수 있고 같은 테마로 움직이는 시계열 데이터라고 볼 수 있습니다. 하지만 우리가 위와 같은 사전 정보가 없이 (AAL이랑 DAL이랑 비슷하게 움직이는것을 모르는채) 이러한 정보를 알아낼수 있는 방법을 가장 잘 나타낸 알고리즘중 하나가 Dynamic Time Warping (DTW) .. 2022. 3. 3.
Dynamic Time Warping (DTW) Dynamic Time Warping (DTW)란? - 시계열 분석에서 DTW는 속도가 다를 수 있는 두 시간 시퀀스 사이의 유사성을 측정하기 위한 알고리즘 중 하나입니다. DTW는 비디오, 오디오 및 그래픽 데이터의 시간적 시퀀스에 적용되었으며 실제로 선형 시퀀스로 변환될 수 있는 모든 데이터는 DTW로 분석할 수 있습니다. 예를들어 아래와 같은 데이터가 있다고 생각해 보겠습니다. a1 = [7,9,6,9,12,6,4,6,8] a2 = [1,1,7,9,6,9,12,6,4] x = [x for x in range(1,10)] plt.plot(x,a1) plt.plot(x,a2) plt.show() 두 데이터는 유사한 패턴을 가지지만 두 데이터의 유사도를 각각의 포인트의 점들로 계산을 한다면 유사도는 그렇.. 2022. 3. 2.
Python 을 이용하여 MDD / Sharp Ratio 구하기 import yfinance as yf import pandas as pd def get_returns(): returns_list = [] for i in range(len(stock_data)-1): today_close = stock_data.iloc[i+1]['Close'] yesterday_close = stock_data.iloc[i]['Close'] returns = (today_close - yesterday_close) / yesterday_close * 100 returns_list.append(returns) returns_list.insert(0,0) # 첫번째 자리에 0 넣어주기 return returns_list def get_max_drawdown(): mdd = (max(st.. 2022. 1. 3.
Data Science 인터뷰 질문 및 답변 (작성중) Data scientist 를 준비하면서 직접 받았던 인터뷰 질문이나, 인터넷에서 찾을 수 있는 질문들을 모아서 꾸준히 답안지를 작성해 보려합니다. 잘못된 정보가 있거나 필요한 질문이 있으면 편하게 알려주세요. 질문출처:https://zzsza.github.io/data/2018/02/17/datascience-interivew-questions/#contents https://www.simplilearn.com/tutorials/data-science-tutorial/data-science-interview-questions Top 50 Data Science Interview Questions and Answers 2022 | Simplilearn Uncover the top Data Science .. 2022. 1. 3.
반응형