본문 바로가기

3. 심화 학습 (Advanced Topics)6

간단한 BERT 모델을 이용하여 GPT 챗봇 성능 높이기 개인 챗봇을 만들어 운영하던 도중 쉽고 재밋는 방법을 구현하게되어 공유하고자 글은 씁니다. GPT의 인기가 높아지면서, 많은 기업과 개인이 언어 모델을 활용하려는 시도를 보게 됩니다. 여러 프로젝트를 진행하며, 프로젝트가 발전해가는 과정에서 종종 간과되기 쉬운, 그러나 매우 중요한 요소가 바로 '프롬프트'입니다. 프롬프트는 언어 모델을 제어하는 데 도움을 주며, 그 사용법에 따라 매우 다양한 결과를 낳을 수 있습니다. 그런데, 프롬프트는 프로젝트의 복잡도가 높아질수록 길어지기 마련이고, 이 때 여러 프롬프트가 서로 엉키게 되면, 오히려 간결한 프롬프트보다 효과가 떨어질 수 있습니다. 이런 문제를 해결하기 위해, 개인 챗봇에 사용되는 점점 길어지는 프롬프트를 관리하는 방법으로 '프롬프트 선택기(Prompt.. 2023. 11. 23.

[논문분석] 딥러닝을 이용하여 불규칙적인 시계열 예측 모델 만들기 (LSTNet) 출저: Modeling Long- and Short-Term Temporal Patterns with Deep Neural Networks (arxiv.org) Github: GitHub - laiguokun/LSTNet GitHub - laiguokun/LSTNet Contribute to laiguokun/LSTNet development by creating an account on GitHub. github.com 1. 개요 - 다중진동 시계열 분석은 실생활에서 흔히 볼 수 있는 현상 중 하나이다. 예를들어, 에너지 사용량이나 교통체증 시간 예측등은 단순 반복적인 시계열 현상보다는 수요가 몰릴 때 더 크게 진동하는 시계열 모델이 될 것이다. 위 논문에서는 이를 해결하기 위해, 딥러닝 프레임워크를 .. 2023. 1. 17.

시계열 분석에서 예측 모델의 구축 및 Stacking을 위한 베이지안 회귀 분석 방법 (2/2) - 구현 먼저 데이터를 불러온 후 null 값을 처리하고 시각화 해보았습니다. (데이터: https://www.kaggle.com/c/rossmann-store-sales) import pandas as pd import numpy as np store = pd.read_csv("../rossmann-store-sales/store.csv") train = pd.read_csv("../rossmann-store-sales/train.csv") test = pd.read_csv("../rossmann-store-sales/test.csv") store.isnull().sum() store.fillna(0, inplace=True) train.isnull().sum() test.fillna(0, inplace=Tru.. 2022. 2. 28.

시계열 분석에서 예측 모델의 구축 및 Stacking을 위한 베이지안 회귀 분석 방법 (1/2) - 설명 Bayesian Regression Approach for Building and Stacking Predictive Models in Time Series Analytics: 연구 출저: https://arxiv.org/pdf/2201.02034.pdf [설명] 이 논문에서는 시계열 모델을 구축하고 다른 예측 모델을 쌓기(stacking) 위한 베이지안 회귀 분석의 사용을 설명합니다. 비선형 추세가 있는 시계열 모델링을 위해 베이지안 회귀를 사용하여 분석했습니다. 이 접근법은 시계열 예측의 불확실성 및 위험 (VaR = Value at Risk)값을 계산할 수 있게 해줍니다. 베이지안 회귀 분석을 사용한 시계열의 계층형 모델 (Hierarchical model)도 고려되었습니다. 이 접근법에서, 파라미.. 2022. 2. 16.

이전 1 2 다음

티스토리툴바