Dacon
-
[dacon] 와인품질 EDA 및 1차 모델 개발ML&DL 2021. 6. 14. 15:35
https://dacon.io/competitions/open/235610/overview/description [화학] 와인 품질 분류 출처 : DACON - Data Science Competition dacon.io 위 데이터를 활용했고, 기존에 작성했던 EDA글을 토대로 진행했다. 여기서 예측해야 하는 Y는 quality이며, 나머지는 feature로 사용해야 한다. 전체 컬럼의 null값은 없고, type만 object 타입인 것을 확인할 수 있다. red, white 계열의 type만 존재하므로 df['type'] = df['type'].replace(['red', 'white'], [0, 1]) 인코딩을 진행했다. 여기선 생략됐지만, 각 컬럼별로 분포가 다르다. scaling을 진행해야 한다..