본문 바로가기

데이터5

Dynamic Time Warping을 이용하여 비슷한 주식 clustering 하기 시계열 데이터를 공부하다 보면 비슷하게 움직이거나 서로 관련이 있는 데이터들을 종종 볼 수가 있습니다. 예를 들어 주식시장 데이터에 빗대어 설명해 보면, 전염병에 민감한 주식인 항공주들 같은 경우 코로나 발생이후 급격히 떨어졌으며 계속 서로 비슷하게 움직이는걸 확인할 수 있습니다. 위 그래프는 미국의 대표 한공사인 American Airline 과 Delta Airline의 그래프입니다. 상당히 비슷하게 움직이는 것을 확인할 수 있고 같은 테마로 움직이는 시계열 데이터라고 볼 수 있습니다. 하지만 우리가 위와 같은 사전 정보가 없이 (AAL이랑 DAL이랑 비슷하게 움직이는것을 모르는채) 이러한 정보를 알아낼수 있는 방법을 가장 잘 나타낸 알고리즘중 하나가 Dynamic Time Warping (DTW) .. 2022. 3. 3.
Data Science 인터뷰 질문 및 답변 (작성중) Data scientist 를 준비하면서 직접 받았던 인터뷰 질문이나, 인터넷에서 찾을 수 있는 질문들을 모아서 꾸준히 답안지를 작성해 보려합니다. 잘못된 정보가 있거나 필요한 질문이 있으면 편하게 알려주세요. 질문출처:https://zzsza.github.io/data/2018/02/17/datascience-interivew-questions/#contents https://www.simplilearn.com/tutorials/data-science-tutorial/data-science-interview-questions Top 50 Data Science Interview Questions and Answers 2022 | Simplilearn Uncover the top Data Science .. 2022. 1. 3.
Statistics 기본 편 - Preview 앞으로 통계학의 기초적인것들을 다뤄볼까 한다. 필자는 statistician은 아니지만 미국에서 경제학을 공부하면서 경제 지표와 데이터를 다루기위해 investing, finance, statistics 등을 배웠으며 배운부분들을 쉽게 다뤄보려한다. 이런말을 한번쯤은 들어 봤을 것이다. "인생은 확률과의 싸움이다." 우리 인생은 통계로 돌아가고 있으며 우리가 선택지의 확률을 매번 미리 알 수 있다면 우리는 좀더 우리 이상과 가까운 삶을 살수 있게 될 것이다. 예를들어, 이번 코로나 사태에서 아래와 같은 질문을 스스로에게 던져보자 Q: 코로나로인한 백신을 맞아야하나? 위와 같은 질문은 어디서도 쉽게 접할 수 있는 우리 사회의 현재 논쟁거리 중 하나이다. 많은 사람들이 백신을 두고 갑론을박을 펼치고 있다. .. 2021. 8. 25.
A/B Testing 란? A/B Testing 이란? - 두가지 샘플에서의 차이점이 통계적으로 의미가 있는지 테스트 하는 검정이다 - 아래 그림을 사용해 예를들어 설명 해보겠다. - 무작위로 control group / variation group 을 나눈 후, variation group 에게 위와같이 웹페이지에 변화를 준 후 두 그룹의 변화를 통계적으로 검정하는 것이다. A/B Testing 순서 1. Formulate hypothesis H0: There is no difference between the control and variant group H1: There is difference between the control and variant group A/B Test 를 진행하기 위해 먼저 가설을 세워야 한다. 가.. 2021. 8. 24.
반응형