분류 전체보기31 간단한 BERT 모델을 이용하여 GPT 챗봇 성능 높이기 개인 챗봇을 만들어 운영하던 도중 쉽고 재밋는 방법을 구현하게되어 공유하고자 글은 씁니다. GPT의 인기가 높아지면서, 많은 기업과 개인이 언어 모델을 활용하려는 시도를 보게 됩니다. 여러 프로젝트를 진행하며, 프로젝트가 발전해가는 과정에서 종종 간과되기 쉬운, 그러나 매우 중요한 요소가 바로 '프롬프트'입니다. 프롬프트는 언어 모델을 제어하는 데 도움을 주며, 그 사용법에 따라 매우 다양한 결과를 낳을 수 있습니다. 그런데, 프롬프트는 프로젝트의 복잡도가 높아질수록 길어지기 마련이고, 이 때 여러 프롬프트가 서로 엉키게 되면, 오히려 간결한 프롬프트보다 효과가 떨어질 수 있습니다. 이런 문제를 해결하기 위해, 개인 챗봇에 사용되는 점점 길어지는 프롬프트를 관리하는 방법으로 '프롬프트 선택기(Prompt.. 2023. 11. 23. [논문분석] 딥러닝을 이용하여 불규칙적인 시계열 예측 모델 만들기 (LSTNet) 출저: Modeling Long- and Short-Term Temporal Patterns with Deep Neural Networks (arxiv.org) Github: GitHub - laiguokun/LSTNet GitHub - laiguokun/LSTNet Contribute to laiguokun/LSTNet development by creating an account on GitHub. github.com 1. 개요 - 다중진동 시계열 분석은 실생활에서 흔히 볼 수 있는 현상 중 하나이다. 예를들어, 에너지 사용량이나 교통체증 시간 예측등은 단순 반복적인 시계열 현상보다는 수요가 몰릴 때 더 크게 진동하는 시계열 모델이 될 것이다. 위 논문에서는 이를 해결하기 위해, 딥러닝 프레임워크를 .. 2023. 1. 17. Croston Model: 시계열 예측에서 간헐 수요에 대한 시계열 예측 방법 간헐적 수요란? - 시계열 데이터에서 꾸준하게 수요가 있는것이 아닌 간헐적으로 수요가 있는것을 말한다. 트랜드와 다르게 값이 0에 수렴할때가 있는 모형이다 (예: 강수량 데이터, 판매량 데이터) Croston 모델은 2가지를 예측한다. 첫번째는 0 이 아닌 수와 0 이 아닌 수까지의 시간 (거리) 를 측정하는 모델이다 이 모델의 특징은 0 이 아닌 Demand 가 일어난 후 forecast 값이 업데이트 되는 특징을 가졌다. 예를 들어, 아래와 같은 판매량 데이터가 있다고 가정해보자. 주말에 판매량이 올라가나, 문을 닫는 날에는 판매가 없어서 수요예측 모델을 사용하기 어려움이 있다. Croston Model은 이러한 경우에 사용할수 있는 모델로, 0과의 거리를 측정한다. 위 예측은 Croston 모델을 .. 2022. 12. 8. 데이콘 쇼핑몰 지점별 매출액 예측 경진대회 (TOP 10%) 개인 스터디중 재밋고 쉬워보이는 대회가 있어서 참가하게 되었습니다. 대회는 시계열대회 예측이였으며 링크는 아래에 있습니다. 개인적으로 기간이 짧아서 아쉬움이 남긴 하지만, 코드를 공유하며 정리했던 생각을 남겨둘려 합니다. STEP 1. Understanding the Problem - 시계열 예측 문제로, 쇼핑몰에서 모은 시계열 데이터를 이용하여 다음 주 매출 (Weekly_Sales)을 예측하는 문제입니다. 데이터는 아래와 같이 구성되어 있습니다. id : 샘플 아이디 Store : 쇼핑몰 지점 Date : 주 단위(Weekly) 날짜 Temperature : 해당 쇼핑몰 주변 기온 Fuel_Price : 해당 쇼핑몰 주변 연료 가격 Promotion 1~5 : 해당 쇼핑몰의 비식별화된 프로모션 정보 .. 2022. 8. 8. 이전 1 2 3 4 5 6 ··· 8 다음 반응형