목록분류 전체보기 (162)
Just Fighting

https://www.datacamp.com/tutorial/tutorial-lasso-ridge-regression위 링크를 참고해 코드를 실행했다. 데이터는 캐글의 Predict Podcast Listening Time의 데이터를 사용했으며,숫자데이터만을 이용해서 청취 시간과의 관계를 알아보기 위해 회귀분석을 진행하고자 한다.https://www.kaggle.com/competitions/playground-series-s5e4 먼저 데이터들의 관계를 살펴보았다.에피소드 별 길이(Episode_Length_minutes)만 유일하게 청취시간(Listening_Time_minutes)와양의 관계를 가진다는 것을 알 수 있다.#librariesimport pandas as pdimport nump..

regression이란? x(독립변수)와 y(종속변수)의 관계를 모델링하는 방식 중 하나보통 선형 회귀를 많이 사용하며, x가 1개면 단순 선형 회귀, 여러 개면 다중 선형 회귀라고 한다. 선형 회귀는 변수와 가중치, 편향으로 표현되며, 다음과 같은 수식으로 정의할 수 있다.$y = \beta_0 + \beta_1 x$ 아래 식을 가장 작게 만드는 $\beta$를 구하면 식이 완성된다.복잡해 보이지만 실제값과 예측값의 오차의 제곱합을 가장 작게하는 값이다.$\beta$값은 식을 미분해서 0이 되는 값으로 한다.$$RSS = \sum_{i=1}^n \left (y_i - \beta_0 - \sum_{j=1}^p \beta_j x_{ij} \right)^2$$ Lidge, Lasso regression..
DLinear는 크게 3개의 단계를 거친다.1. 시계열 분해2. 예측3. 예측결과 합산 이 과정을 코드를 이용해 뜯어보고자 한다! 1. 시계열 분해시계열 분해는 이동평균을 통해 trend(경향)을 얻어낸 후에원 데이터에서 trend의 값을 뺀 값을 얻는데, 그 값이 seasonal(계절성)이 된다. import torchimport torch.nn as nnimport torch.nn.functional as Fimport numpy as npclass moving_avg(nn.Module): """ Moving average block to highlight the trend of time series """ def __init__(self, kernel_size, stride)..

알고리즘 개발을 하던 도중에 and와 or연산의 새로운 사용법을 깨달았다.그래서 정리! 보통 bool값과 and, or 연산은 다음과 같이 한다. 기본적으로 파이썬에서는 숫자 0, 비어있는 문자열을 False로 여긴다.그러나, 0이나 ''의 값으로 위와 같은 연산을 진행했을 때랑은 결과가 조금 다르다. 앞의 값으로 연산의 결과가 확정되면 앞의 값을 리턴하고,앞의 값이 아닌 뒤의 값으로 연산의 결과가 확정나면 뒤의 값을 리턴한다. 이 내용을 정리하게 된 상황도 함께 정리한다. 두 개의 변수가 있고, 문자열 혹은 빈 문자열을 값으로 가진다.그 두개의 값이 모두 존재하면 'A / B'로 리턴하고,둘 중 하나의 값만 있을 땐, 'A' 혹은 'B'를 리턴둘 다 빈 문자열을 가지면, 'C'를 리턴하게끔 만들..