본문 바로가기

전체 글31

Reddit에서 코인뉴스 API로 크롤링하기 import requests import pandas as pd # Token 구하기 auth = requests.auth.HTTPBasicAuth(CLIENT_ID, SECRET_KEY) data = { 'grant_type' : 'password', 'username' : username, 'password' : password } headers = {'User-AGent': 'MyAPI/0.0.1'} res = requests.post('https://www.reddit.com/api/v1/access_token', auth = auth, data = data, headers = headers)​ TOKEN = res.json()['access_token'] headers = {**headers, .. 2021. 12. 28.
제1장. Descriptive Statistics 통계에서 기초적인 sampling 및 descriptive statistics 를 다뤄보도록 하겠습니다. 먼저 금융 데이터 중 나스닥, ETF(ARKK), TSLA 세가지 데이터를 가지고 분석해보겠습니다. 만약 내가 지금 시드머니가 천만원이 생겼고 그 천만원을 가지고 위에 세군대중 한군대에 투자를 해보려고한다면 어떻게 통계를 사용할 수 있을까? 1. 데이터 Load import pandas as pd import numpy as np import investpy from scipy.stats import sem from scipy.stats import kurtosis nasdaq = investpy.search_quotes(text='nasdaq', products=['indices'], countri.. 2021. 9. 6.
Statistics 기본 편 - Preview 앞으로 통계학의 기초적인것들을 다뤄볼까 한다. 필자는 statistician은 아니지만 미국에서 경제학을 공부하면서 경제 지표와 데이터를 다루기위해 investing, finance, statistics 등을 배웠으며 배운부분들을 쉽게 다뤄보려한다. 이런말을 한번쯤은 들어 봤을 것이다. "인생은 확률과의 싸움이다." 우리 인생은 통계로 돌아가고 있으며 우리가 선택지의 확률을 매번 미리 알 수 있다면 우리는 좀더 우리 이상과 가까운 삶을 살수 있게 될 것이다. 예를들어, 이번 코로나 사태에서 아래와 같은 질문을 스스로에게 던져보자 Q: 코로나로인한 백신을 맞아야하나? 위와 같은 질문은 어디서도 쉽게 접할 수 있는 우리 사회의 현재 논쟁거리 중 하나이다. 많은 사람들이 백신을 두고 갑론을박을 펼치고 있다. .. 2021. 8. 25.
A/B Test 실전 Columns Description auction_id: the unique id of the online user who has been presented the BIO. In standard terminologies this is called an impression id. The user may see the BIO questionnaire but choose not to respond. In that case both the yes and no columns are zero. experiment: which group the user belongs to - control or exposed. control: users who have been shown a dummy ad exposed: user.. 2021. 8. 24.
반응형