본문 바로가기

Euron/정리

(21)
[Week3] 04. 분류(2) 중간에 모듈 설치하면서 오류가 났다.anaconda가 원래 오류가 많이 난다고 한다....그럴 때는 pip로 주피터 노트북에 직접 설치하기.오류찾기 힘들어서 중간에 colab으로 해볼까...했는데 운영진의 도움으로 해결했다.05. GBM(Gradient Boosting Machine) 부스팅 알고리즘은 여러 약한 학습기를 순차적으로 학습-예측하면서 잘못 예측한 데이터에 가중치 부여를 통해 오류를 개선해 나가면서 학습하는 방식이다.대표적으로 에이다 부스트(AdaBoost)와 그래디언트 부스트(Gradient Boost)가 있다.두 방법 모두 오류 데이터에 가중치를 부여하며 업데이트 하지만, GBM은 경사 하강법(Gradient Descent)을 이용한다.실제 결괏값=y, 피처 = x, 피처에 기반한 예측 ..
[Week2] 04. 분류(1) 01. 분류(Classfication)의 개요 지도학습의 대표적인 유형인 분류(Classification)을 배운다. 분류는 기존 데이터가 어떤 레이블에 속하는지 패턴을 알고리즘으로 인지한 뒤에 새롭게 관측된 데이터에 대한 레이블을 판별하는 것이다. 분류 구현 ML 알고리즘 나이브 베이즈 : 베이즈 통계와 생성 모델 기반 로지스틱 회귀 : 독립변수와 선형 관계성에 기반 결정 트리 : 데이터 균일도에 따른 규칙 기반 서포트 벡터 머신 : 개별 클래스 간의 최대 분류 마진을 효과적으로 찾아주는 서포트 벡터 머신 최소 근접 알고리즘 : 근접 거리 기준 신경망 : 심층 연결 기반 앙상블 : 서로 다른(또는 같은) 머신러닝 알고리즘을 결합 분류에서 가장 각광받는 방법 중 하나인 앙상블 방법(Ensemble Met..
[Week1] 03. 평가 머신러닝은 데이터 가공/변환, 모델 학습/예측, 그리고 평가(Evaluation)의 프로세스로 구성된다. 회귀의 성능 평가 지표는 주로 실제값과 예측값의 오차 평균값에 기반한다. 분류의 성능 평가 지표 정확도(Accuracy) 오차행렬(Confusion Matrix) 정밀도(Precision) 재현율(Recall) F1 스코어 ROC AUC 분류는 2개의 결괏값만을 가지는 이진 분류와 여러 결정 클래스 값을 가지는 멀티 분류로 나뉜다.(위는 전부 가능) 01. 정확도(Accuracy) 실제 데이터에서 예측 데이터가 얼마나 같은지를 판단하는 지표 불균형한 레이블 값 분포에서 ML 모델의 성능을 판단할 경우 적합하지 않다. 02. 오차 행렬 이진 분류의 예측 오류가 얼마인지와 어떠한 유형의 예측 오류가 발생..
[Week1] 02. 사이킷런으로 시작하는 머신러닝 01. 사이킷런 소개와 특징 Anaconda를 설치하면 기본으로 설치가 완료된다. 내 버전은 1.2.2 이다. 추천하는 버전은 1.0.2인데 다른 모듈이랑 충돌이 나는 듯...다운그레이드가 안된다. 일단 실행에는 문제가 없어서 그냥 이 버전으로 실습함. 02. 첫 번째 머신러닝 만들어 보기 - 붓꽃 품종 예측하기 대표적인 지도학습의 방법 중 하나인 분류(Classification)을 이용한다. 함수 정리 sklearn.databases : 사이킷런에서 자체적으로 제공하는 데이터 세트를 생성하는 모듈의 모임 load_iris() : 붓꽃 데이터 생성 sklearn.tree : 트리 기반 ML 알고리즘을 구현한 클래스의 모임 DecisionTreeClassifier : ML 알고리즘으로 의사 결정 트리(De..
[Week1] 01. 파이썬 기반의 머신러닝과 생태계 이해 Euron 첫 예습과제... 열심히 해야지. CV 관련 공부도 필요하다. 이라는 책을 참고해볼 계획 01. 머신러닝의 개념 머신러닝이란? - 애플리케이션을 수정하지 않고도 데이터를 기반으로 패턴을 학습하고 결과를 예측하는 알고리즘 기법 머신러닝의 분류 지도학습 분류 회귀 추천 시스템 시각/음성 감지/인지 텍스트 분석, NLP 비지도학습 클러스터링 차원 축소 강화학습 R또한 머신러닝 부분에서 많이 쓰인다. 다만 R은 통계 전용 프로그램 언어이고, 파이썬은 개발 생산성이 뛰어나다. 파이썬은 여러 딥러닝 프레임워크, 대표적으로 텐서플로(TensorFlow), 케라스(Keras), 파이토치(pyTorch) 등, 가 파이썬을 지원하고 있다. 02. 파이썬 머신러닝 생태계를 구성하는 주요 패키지 주요 필요 패키지 ..