목록2025/05 (3)
Just Fighting

https://www.datacamp.com/tutorial/tutorial-lasso-ridge-regression위 링크를 참고해 코드를 실행했다. 데이터는 캐글의 Predict Podcast Listening Time의 데이터를 사용했으며,숫자데이터만을 이용해서 청취 시간과의 관계를 알아보기 위해 회귀분석을 진행하고자 한다.https://www.kaggle.com/competitions/playground-series-s5e4 먼저 데이터들의 관계를 살펴보았다.에피소드 별 길이(Episode_Length_minutes)만 유일하게 청취시간(Listening_Time_minutes)와양의 관계를 가진다는 것을 알 수 있다.#librariesimport pandas as pdimport nump..

regression이란? x(독립변수)와 y(종속변수)의 관계를 모델링하는 방식 중 하나보통 선형 회귀를 많이 사용하며, x가 1개면 단순 선형 회귀, 여러 개면 다중 선형 회귀라고 한다. 선형 회귀는 변수와 가중치, 편향으로 표현되며, 다음과 같은 수식으로 정의할 수 있다.$y = \beta_0 + \beta_1 x$ 아래 식을 가장 작게 만드는 $\beta$를 구하면 식이 완성된다.복잡해 보이지만 실제값과 예측값의 오차의 제곱합을 가장 작게하는 값이다.$\beta$값은 식을 미분해서 0이 되는 값으로 한다.$$RSS = \sum_{i=1}^n \left (y_i - \beta_0 - \sum_{j=1}^p \beta_j x_{ij} \right)^2$$ Lidge, Lasso regression..
DLinear는 크게 3개의 단계를 거친다.1. 시계열 분해2. 예측3. 예측결과 합산 이 과정을 코드를 이용해 뜯어보고자 한다! 1. 시계열 분해시계열 분해는 이동평균을 통해 trend(경향)을 얻어낸 후에원 데이터에서 trend의 값을 뺀 값을 얻는데, 그 값이 seasonal(계절성)이 된다. import torchimport torch.nn as nnimport torch.nn.functional as Fimport numpy as npclass moving_avg(nn.Module): """ Moving average block to highlight the trend of time series """ def __init__(self, kernel_size, stride)..