전체 글 119

파이썬 9일차 - 머신러닝 개념정리 (결정트리, 디시젼트리)

from sklearn.tree import DecisionTreeClassifier # 디시젼트리 불러오기 from sklearn.datasets import load_iris from sklearn.model_selection import train_test_split # 학습, 에측 불러오기 # 워닝 무시 import warnings warnings.filterwarnings('ignore') 디시젼트리 그래프비즈로 시각화 from sklearn.tree import export_graphviz # export_graphviz()의 호출 결과로 out_file로 지정된 tree.dot 파일을 생성함. export_graphviz(dt_clf, out_file="tree.dot", class_name..

파이썬 8일차 - 머신러닝 개념정리 (정확도_ROC_AUC)

평가 학습 데이터로 분류 모델을 만들고, 이를 테스트 데이터에 넣어서 좋은 모델인지 성능을 평가하고자 한다. 이 때 사용되는 분류 성능평가 지표들과 함수들에 대해 알아보자 - 오차행렬 - 정확도 - 정밀도,재현율 - 정밀도와 재현율의 (trade-off) 관계 - F1 Score - ROC AUC 정확도 - 이진 분류 시 정확도는 그닥 좋은 평가 지표는 아니다. - 예제 참고 오차행렬 정밀도와 재현율의 관계 F1 Score ROC Curve와 AUC

파이썬 7일차 - 머신러닝 개념정리 (iris(붓꽃)데이터)

from sklearn.datasets import load_iris # iris 데이터 로드 사이킥런 안에 있는 데이터 from sklearn.tree import DecisionTreeClassifier # 의사결정나무 분류기 from sklearn.model_selection import train_test_split # 학습,테스트 데이터 분리 - 변수 = load_iris() : 사이킷런에 있는 iris 데이터를 사용 하기 위해서는 객체를 만들어줘야 한다 - 변수 = iris.data : 피쳐(내용) 데이터를 가져온다 - 변수 = iris.target : 레이블(결정값) 데이터를 가져온다 - iris.target_names : iris 리이블 명을 가져온다 - DataFrame으로 변환하면 보기..