'분류 전체보기' 카테고리의 글 목록 (10 Page)

2023.10.14· 🐍 Python/Python basic

📌 python while문 for문 전에 간단하게 쓸 수 있는 반복문이 바로 while 입니다. while 조건식 : 조건식이 True일 경우 반복적으로 실행되는 명령문 입니다. 이게 왜? 반복문이냐? 이유는 *해당 조건이 False가 될 경우 반복문을 종류하기 때문입니다. * 바로 코드로 보시죠. i = 0 while i > i는 0 입니다. >> i는 1 입니다. >> i는 2 입니다. >> i는 3 입니다. >> i는 4 입니다. while i < 5: : i가 5 미만인 것이 True일 경우 반복한다. print('i는', i, '입니다,') : i에 할당된 숫자를 out하여 print하도록 한다. i = i +1 : i에 1일..

Python : if문

2023.10.14· 🐍 Python/Python basic

📌 python if문(조건문) 이번엔 조건문을 알아보겠습니다. 크게 if, elif, else문이 있습니다. if는 조건식의 결과가 True일 경우 실행될 명령문입니다. 조건식의 첫 문장을 이룹니다. elif는 if의 다음 문장부터 사용하며, 조건식의 결과가 True일 경우 실행될 명령문입니다. else는 if와 elif 모두 포함이 되지 않는 False일 때 실행될 명령문 입니다. 아래 코드를 보시면 이해가 쉬울 것입니다. money = 50 if money 100원 이하 입니다. money를 50원으로 지정해주었기 때문에 if문에 걸려 100원 이하라고 알려줍니다. money = 250 if money 100원 초과, 500원 이하 입니다. money를 250원으로 지정해주었기 때문에 elif문에 ..

Python : 기초연산자

2023.10.14· 🐍 Python/Python basic

📌 python 비교 연산자 아래 코드를 확인해주세요. a = 5 b = 20 print(a > b) # 크다 >> False print(a >= b) # 크거나 같다 >> False print(a > True print(a > True print(a == b) # 같다 >> False print(a != b) #다르다 >> True 이상 python 기초 연산자였습니다! ☠️

Python : 기초 연산

2023.10.14· 🐍 Python/Python basic

파이썬을 배운지는 참 오래됐네요. 그런데 학과 특성상 R을 써왔습니다. 그런데 현업 분들 말을 들어보니 파이썬을 많이 사용한다해서! 안그래도 파이썬을 다시 공부하고 싶었거든요 ㅎㅎ 그래서 기초적인 부분부터 복습해가면서 포스팅 하려고 합니다!! 📌 python 변수 종류 ◾ 숫자형(numeric types) 이번에 볼 숫자형은 두가지 입니다. integer 타입으로 정수형 그리고 floating-point 타입으로 실수형이 있습니다. a = 14 print(a, type(a)) >>> 14 print 함수로 a에 할당한 내용과 내용의 타입을 반환하였습니다. 위 처럼 일반 정수가 나오는게 int b = 14.0 print(b, type(b)) >>> 14.0 위처럼 소수점이 있는 것이 float ◾ 문자형(..

변수 중요도 : Mean Decrease Impurity, Mean Decrease Accuracy

2023.10.13· ⚙️ Machine Learning/Machine learning

📌 Variable importance measures.(요인 중요도) 단일 트리 모델의 경우 예측할 때 어떤 요인이 중요한지 쉽게 알 수 있습니다. 하지만, 여러 트리들을 묶어 사용하는 Bagging의 방법에서는 이러한 요인 중요도를 쉽게 얻을 수 없습니다. 예측 정확도가 높은 대신, 설명력이 떨어지는 것이죠. 설명력을 위해 어떤 변수가 중요한지 보는 방법을 2가지를 알아보고 후 포스팅에서 최근 유행하는 SHAP에 대해서 알아보려 합니다. ◼️ Mean Decrease Impurity(MDI) 회귀 트리의 경우, 주어진 예측 변수에 대한 분할로 인해 RSS(residual sum of squares)가 얼마나 감소되었는지를 모든 T개의 트리에 대해 평균화한 총량을 볼 수 있습니다. 쉽게 설명하면 어떠한..

손실함수와 회귀식

2023.10.12· 📊 Statistics for Basic/통계 학습(Statistical learning)

📌 선형회귀에 대하여 우선 선형회귀의 경우 Supervised learning으로 지도 학습의 일종입니다. 먼저 가정을 해봅시다. $X$ : input으로 perdictors, covariates, independent variables, features 등으로 불리웁니다. 저같은 경우 feature라고 많이 부르는거 같아요 $Y$ : output으로 reponse variable, dependent variables 등으로 불립니다. 제 전공인 심리학에서는 보통 dependen variables라고 많이 불리우는데 저는 그냥 output으로 부르는게 편하더라구요 $n$ : observations으로 distinct data points의 개수 입니다. $p$ : variables의 수입니다. $n, p..

편향과 분산 : trade off와 MSE의 관계

2023.10.12· 📊 Statistics for Basic/통계 학습(Statistical learning)

우리는 흔히 편향과 분산이 trade off 관계라고 알고있습니다. 알 사람은 다 알겠지만.. 한번 왜 그런지 확인해보는 시간을 가지려고 합니다 📌 MSE 우선 MSE에 대해서 봅시다. 우리가 MSE에 대해서 이렇게 표현합니다. $$ MSE = E(y-\hat{f}(\textbf{x}))^2 = Var(\hat{f}(\textbf{x}))+Bias(\hat{f}(\textbf{x}))^2 + Var(\epsilon) $$ MSE = (실제값과 예측값) 제곱의 기댓값 = 예측값의 분산 + 예측값 편향의 제곱 + 노이즈 이렇게 이루어져 있습니다. 이를 한번 유도해 봅시다. ◾ 에러 분산의 유도 $Var(\epsilon)$의 유도입니다. 여기서 필요한 개념은 $y = f(x) + \epsilon$ 이라는 것 ..

Validation set와 MSE : Validation set를 사용하는 이유

2023.10.12· 📊 Statistics for Basic/통계 학습(Statistical learning)

보통 우리가 알기론 train set, test set로 나누어 모델을 학습, 평가합니다. 그런데 이를 제외하고 validation set를 추가하는 경우가 있습니다. 왜 일까요? 📌 MSE 그리고 validation set 우선 우리가 모델 학습의 성능을 보기위해 보는 MSE(Mean square error)에 대해 봅시다. 식과 같은 경우 $$ MES(\hat{f}) = \frac1n\sum^n_{i=1}(y_i - \hat{f}(\textbf{x}_i))^2 $$ 이렇게 이루어 집니다. 즉, 예측을 잘 못할수록 값이 커지는 구조이죠. 자 여기서 우리가 training data와 이와 관련 없는 test data가 있다고 해봅시다. training data : ${(y_1,\textbf{x}_1),...

로지스틱 회귀(Logistic Regression)

2023.10.12· 📊 Statistics for Basic/통계 학습(Statistical learning)

📌 로지스틱 회귀(Logistic Regression) 만약, 특정 사람이 외향적인지를 분류한다고 해봅시다.(외향 vs 내향이 아닙니다. 외향 Yes vs No 입니다) 반응 변수 명을 $x_1$라고 하면 두 개의 범주 Yes or No 가 있을 것입니다. 로지스틱 회귀는 반응 변수 Y를 직접 모델링하지 않고 Y가 특정 범주에 속하는 확률을 모델링 합니다. 추가적인 예로 일주일에 외출 횟수를 설명 변수로 사용하고, 변수 명을 out이라고 하였을 때, out에 대한 외향적일 확률을 다음과 같이 표시할 수 있습니다. Pr(Ex = Yes|out)이 값을 줄여서 p(out)라고 하고, 범위는 0~1입니다. 이를 이용해 임의의 주어진 out에 대해 Ex를 예측 할 수 있습니다. 예를 들어 p(out) > 0.5..

전진 단계적 선택(Forward stepwise), 후진 단계적 선택(Backward stepwise)

2023.10.12· 📊 Statistics for Basic/통계 학습(Statistical learning)

📌 선형모델의 확장 : 부분집합 선택법 우선 부분집합 선택법을 간단히 알아봅시다. 선형모델의 적합절차를 수행하기 위해 p개인 설명변수의 가능한 조합 각각에 대해서 최소제곱회귀를 적합합니다. 쉽게 설명한다면 단 하나의 설명변수를 포함하는 모델 p개 두 개의 설명변수를 포함하는 모델 p(p-1)/2 개 ... 이런 식으로 모든 모델들을 적합합니다. 그 다음 이 모델들중에 가장 좋은 모델을 찾아내는 것이죠. 예시로 설명해봅시다. 설면변수가 3개 있다면 이를 A, B, C로 놓아 봅시다. 이에 대해 가능한 모델 조합은 y = x y = Ax / y = Bx / y = Cx y = Ax_1 + Bx_2 / y = Ax_1 + Cx_2 / y = Bx_1 + Cx_2 y = Ax_1 + Bx_2 + Cx_3 이렇게..

◼️ 모든 글 ◼️

티스토리툴바