코딩 기록들

[ AI기초 ] 05-1. 사이킷런 실습 (iris, 분류 알고리즘) 본문

AI 기초

[ AI기초 ] 05-1. 사이킷런 실습 (iris, 분류 알고리즘)

코딩펭귄 2022. 10. 30. 20:36

  붓꽃 예제 실습  

- 주제 : 붓꽃 품종 예측 머신러닝 모델 생성

- 상황 : 한 아마추어 식물학자가 들에서 발견한 붓꽃의 품종을 알고싶어함. 이 식물학자는 붓꽃의 꽃잎(petal)과 꽃받침(sepal)의 혹과 길이를 cm단위로 측정함. -> 전문 식물학자가 setosa, versicolor, virginica 3종으로 분류한 붓꽃 측정 데이터를 보유하고있음. 이 측정값을 이용해 채집한 붓꽃의 품종을 구분하고자 함.

- 알고리즘 : 지도학습 - 분류classification

- 클래스 : 출력될수있는 값 ( = 3개 붓꽃의 종류 )

- 레이블 : 특정 데이터 포인트에대한 출력( = 품종 )

데이터적재. dateset = scikit-learn의 datasets 모듈에 포함
붓꽃 iris 데이터를 학습에 사용하기 위해, 학습용 데이터와 테스트 데이터로 나눠서 사용한다 (X_train, X_test, y-train, y-test)
열의 이름은 iris_dataset.feature_names에 있는 문자열 사용 / 두번째 박스의 코드를 보면, 데이터프레임을 사용해 y_train에 따라 색으로 구분된 산점도 행렬을 생성하라는것을 볼수있음