파이썬 (쥬피터) [2021.04.22] 64

파이썬 8일차 - 머신러닝 개념정리 (정확도_ROC_AUC)

평가 학습 데이터로 분류 모델을 만들고, 이를 테스트 데이터에 넣어서 좋은 모델인지 성능을 평가하고자 한다. 이 때 사용되는 분류 성능평가 지표들과 함수들에 대해 알아보자 - 오차행렬 - 정확도 - 정밀도,재현율 - 정밀도와 재현율의 (trade-off) 관계 - F1 Score - ROC AUC 정확도 - 이진 분류 시 정확도는 그닥 좋은 평가 지표는 아니다. - 예제 참고 오차행렬 정밀도와 재현율의 관계 F1 Score ROC Curve와 AUC

파이썬 7일차 - 머신러닝 개념정리 (iris(붓꽃)데이터)

from sklearn.datasets import load_iris # iris 데이터 로드 사이킥런 안에 있는 데이터 from sklearn.tree import DecisionTreeClassifier # 의사결정나무 분류기 from sklearn.model_selection import train_test_split # 학습,테스트 데이터 분리 - 변수 = load_iris() : 사이킷런에 있는 iris 데이터를 사용 하기 위해서는 객체를 만들어줘야 한다 - 변수 = iris.data : 피쳐(내용) 데이터를 가져온다 - 변수 = iris.target : 레이블(결정값) 데이터를 가져온다 - iris.target_names : iris 리이블 명을 가져온다 - DataFrame으로 변환하면 보기..

파이썬 6일차 - 머신러닝 개념정리 (Numpy)

ndarray - np.array() : array, list 함수 생성 - .shape : 행렬표시 - .ndim : 차원표시 (1차원, 2차원) - 정수와 문자열 입력시 같은 데이터 타입으로 변환됨 (문자열로) astype() - .astype() : 데이터 타입을 변화 - .sum() : 행렬 전체 합 - .sum(axis=0) : 열의 합 - .sum(axis=1) : 행의 합 reshape() - np.arange(10) : 0부터 10번째까지의 ndarray 생성 (0,1,2,3,4,5,6,7,8,9) - np.zeros( , ) : 주어진 행렬의 모든 값이 0 - np.ones( , ) : 주어진 행렬의 모든 값이 1 - .reshape(2,5) : 주어진 리스트 값의 행렬을 만듬 ((2,5..