본문 바로가기

기타

(17)
정기 예금 가입 여부 예측 데이터 다루기(2) 이전에 만든 데이터세트를 가지고 모델을 만든다.이전에 PyCaret을 통해 간단하게 모델들을 돌려봤는데, 가장 좋은 성능을 보여준 lightGBM, Gradient Boosting Classifier, Logisitic Regression을 중심으로 학습할 예정이다.+ 임시로 돌려볼 모델들# Pycaret으로 모델 돌려보기 # Pycaret 간단 정리!pip install pycaret # model 비교 라이브러리 설치from pycaret.classification import *exp_clf = setup(data = train, target = 'y', session_id=123) # data setup 보기models() # 사용되는 models 보기best_model = compare_mode..
정기 예금 가입 여부 예측 데이터 다루기 Pattern Recognition Course Project 중 데이터 전처리 과정 정리과제는 주어진 데이터를 활용하여 고객의 신용카드 유무를 예측하는 것이다.# 데이터 확인실제 data set가 아닌 과제용 data set기에 약간 다르다. non-null 데이터만 있는 것 처럼 보이지만 아니다.categorical data에 null data, 즉 결측치는 unknown이라는 label로 있다. # numerical data(수치형 데이터)   # categorical data(범주형 데이터) 몇몇 unknown 데이터가 존재한다.딱히 이상치를 보거나 할 게없으니 패스 # 데이터 전처리# 상관관계데이터간 상관관계를 확인한다.상관관계가 높으면(독립 변수 간 선형 상관관계가 있으면) 다중공산성이 있다고..
Git 관리하자 졸프 멘토링 시간에 내 코드 설명하다가 Git 관련 지적을 받았다..ㅎㅎ branch 명이 지저분하다는 것! dev야 배포하면서 자주 사용되는 것이지만...나머지는 그냥 1인 개발이라 내가 임의로 대충 주요 기능별로 나눠서 관리 했다. 멘토분께서 branch명의 팁을 알려주셨다. 보통 featrue/// 이렇게 관리한다고 하심! 이렇게 만든 issue의 번호를 branch의 끝에 붙이면 merge할 때 저절로 issue가 close된다고 한다! 시험삼아 간단하게 readme만 수정하고 main branch에 merge해봤다. 실제였다면 다른 누군가가 comment를 해주었겠지만..! 소규모는 그런거 없다. 근데 안됨..읭? 검색해보니 저걸로 만들어야함. 난 git이 알아서 branch이름으로 어떻게..해..
[AWS] AWS Public IPv4 주소 요금 변경2 + Q&A AWS support에 올렸던 질문에 답이 왔다. 보통은 하루정도 걸리는데 이번에 바뀐 요금제 때문에 질문이 많은지 3일 넘게 걸렸다. 로드밸런서의 IPv4 주소 할당을 비활성화 했음에도 요금이 청구되고 있는 건에 대하여 질문을 올렸다. 기술보다는 요금 질문에 가깝다고 생각했는데 아니였군... 대신 repost라는 AWS 서비스 질의응답 사이트에 가입해서 다시 물어봤다. 답변은 금방 달린다. 일단 대부분의 답변은...내가 한 것처럼 서브넷에서 IPv4 관련 설정을 바꾼다고 해도 로드밸런서 서브넷에 대한 public IPv4할당을 삭제할 수 없다고 한다. 왜냐면...ALB는 IPv4 전용 혹은 IPv4와 IPv6 둘다 사용하는 듀얼 스택만 선택가능하기 때문! 좌절하고 있었는데 누군가 답을 줬다. 로드밸런서..
[AWS] AWS Public IPv4 주소 요금 변경 + 문의 갑자기 AWS에서 만원정도 청구됐다. 청구서를 자세히 보자. 오잉? 갑자기 IPv4 주소 사용에서 요금이 첨부됨. 검색해보니 2024년 2월 1일부터 서비스 연결 여부에 관계없이 모든 퍼블릭 IPv4 주소에 대해 시간당 IP당 0.005 USD의 요금이 부과된다고 한다...ㅜㅜ https://aws.amazon.com/ko/blogs/korea/new-aws-public-ipv4-address-charge-public-ip-insights/ 공지 – AWS Public IPv4 주소 요금 변경 및 Public IP Insights 기능 출시 | Amazon Web Services AWS에서 퍼블릭(Public) IPv4 주소에 대한 새로운 요금이 도입됩니다. 2024년 2월 1일부터 서비스 연결 여부에 ..
인류문명과환경공학 정리 이화여자대학교 인류문명과환경공학 중간정리 평균은 넘었다...! 짧지만 열심히 정리해서 삭제하기 전에 백업 중간 84 기말 89인데 A-받았다ㅜ 좀 짜다..
[Sklearn] 회귀 알고리즘 정리 일반 선형 회귀 : 예측값과 실제 값의 RSS를 최소화 할 수 있도록 회귀 계수 최적화 릿지(Ridge) : 선형 회귀에 L2 규제 추가 라쏘(Lasso) : 선형 회귀에 L1 규제 추가, 피처 선택 기능 엘라스틱넷(ElasticNet) : L2, L1 규제를 함께 결합 로지스틱 회귀(Logistic Regression) : 분류에 사용되는 선형 모델 회귀 트리 : 트리 기반 회귀 방식 먼저 회귀란, 여러 개의 독립변수와 한 개의 종속변수 간의 상관관계를 모델링 하는 기법을 통칭한다. 즉, Y= W1*X1 + W2*X2 + ... + Wn*Xn 이라는 선형 회귀식에서 Y는 종속 변수, X는 독립 변수, W는 독립 변수의 값에 영향을 미치는 회귀 계수(Regression coefficients..
[Sklearn] 분류 알고리즘 정리 결정 트리 : 데이터 균일도에 따른 규칙 기반의 결정트리, 매우 단순한 구조 나이브 베이즈 : 베이즈 통계와 생성 모델에 기반, 조건부 확률 로지스틱 회귀 : 독립 변수와 종속 변수의 선형 관계성, 일반적이고 효과적인 분류 서포트 벡터 머신 : 개별 클래스 간의 최대 분류 마진 찾기, 명확한 분류와 고차원 공간 최소 근접 알고리즘 : 근접 거리 기준, 데이터 간의 유사한 특징 기반 분류 신경망 : 심층 연결 기반, 딥러닝 앙상블 : 서로 다른(or 같은) ML 알고리즘 결합, 더 나은 예측 결과를 도출하고자 할 때 결정트리(Decision Tree) 데이터에 있는 규칙을 학습을 통해 찾아내 트리 기반의 분류 규칙을 만든다. 최종적으로 만들어진 리프 노드가 클래스 값을 가지며, 예측할 데이터는..