전체 글31 A/B Testing 란? A/B Testing 이란? - 두가지 샘플에서의 차이점이 통계적으로 의미가 있는지 테스트 하는 검정이다 - 아래 그림을 사용해 예를들어 설명 해보겠다. - 무작위로 control group / variation group 을 나눈 후, variation group 에게 위와같이 웹페이지에 변화를 준 후 두 그룹의 변화를 통계적으로 검정하는 것이다. A/B Testing 순서 1. Formulate hypothesis H0: There is no difference between the control and variant group H1: There is difference between the control and variant group A/B Test 를 진행하기 위해 먼저 가설을 세워야 한다. 가.. 2021. 8. 24. 간단한 NLP 모델로 WSJ 부정적인 기사만 crawling 하기 일상에서 우리가 데이터를 가장 쉽게 접할 수 있는 곳은 인터넷일것이다. 인터넷에는 수많은 데이터가 있지만, 각각 하나하나의 데이터는 큰 힘을 갖지 못하고 효율적으로 데이터를 다루기가 어렵다. 많은 데이터를 가공하고 특징을 찾아내기 위해서 가장 흔하게 쓰이는 방법은 크롤링(crawling)일 것이다. 오늘은 간단한 NLP 모델을 만들어 부정적인 단어가 들어가 있는 기사만 crawling 해 볼것이다. 데이터 출저: https://data.world/crowdflower/sentiment-analysis-single-word Sentiment Analysis Single Word - dataset by crowdflower Sentiment analysis of single words or short phr.. 2021. 8. 23. VAR을 이용하여 Kospi 예측해보기 VAR 이란? - VAR은 두개 이상의 시계열 데이터를 사용해 앞으로를 예측하는 알고리즘이다 VAR특징 - 두개 이상의 시계열 데이터를 가지고 있어야 하며, 한 시계열 데이터가 다른 시계열 데이터에게 영향을 줌 - lags (지연된 시간 값)을 가지고 있으며 데이터는 stationary 해야함. - AR, ARMA, ARIMA 모델과는 다르게 VAR은 양방향성(bi-direction)을 가짐 (예: 금가격은 달러가격에 영향이 있다 / 달러가격은 금가격에 영향이 있다) VAR의 간단한 수식은 아래와 같다 (출저:Wikipedia) 수식은 2개의 시계열 데이터가 있을 때 공식을 나타낸것이다. 이러한 모델은 VAR(1) 모델이라 하며 lag order 이 1 인 VAR 모델이다. 이번시간에 모델을 만들기 위해.. 2021. 8. 19. Granger's Causality Test Granger's Causality란? - 1969년에 처음 발명된 통계기법으로 시계열 데이터 x 가 얼마나 y에 영향을 끼치는지 알아볼 수 있는 Test이다. Null Hypothesis = x does not Granger-cause y P-value가 0.05 보다 낮다면 Null hypothesis 를 reject 할 수 있으며, 곧 x가 y에게 유의미하게 영향을 끼쳤단 뜻이다. 1. Hang Seng 2. Kospi 3. S&P 500 4. Shanghai Composite 먼저 필요한 라이브러리를 import 해준다 import numpy as np import pandas as pd from statsmodels.tsa.stattools import grangercausalitytests 새.. 2021. 8. 18. 이전 1 ··· 4 5 6 7 8 다음 반응형