AI 기초

[ AI기초 ] 02. Data ?

코딩펭귄 2022. 10. 26. 23:10

steps
1. 해당영역에 대한 이해 : understand the business domain
2. 영역의 '진짜문제'가 무엇이지를 파악 : understand the business problem
3. what is the right data, right column, and right algorithm
4. combine knowledge with machine learning

x=feature, y=Label 
y = wx + b (w=연봉상승률, x=근속연수, b=초봉)

중요한것 : data, algorithm, parameter(hyper parameter : 잘 조정해서 맞추는것) 잘 조정하기

x값들중 뽑아냄 : trains set(학습용), test set(테스트용)

 랜덤으로 할 때는 seed값 줘야함


우리가 사용할수있는 데이터 구할수있는방법 (open data) : kaggle