머신러닝 학습에 대한 기본 흐름 2022.01.27 파이썬 머신러닝 완벽 가이드
챕터 2까지는 분류기를 사용해서 머신러닝의 학습 방법에 대해 간단하게 알아보았습니다. 미래를 위해 대략적인 머신러닝 학습에 대한 flow를 기록해보고자 합니다.
챕터 2까지는 분류기를 사용해서 머신러닝의 학습 방법에 대해 간단하게 알아보았습니다. 미래를 위해 대략적인 머신러닝 학습에 대한 flow를 기록해보고자 합니다.
데이터들을 학습시키기 전에 우리는 반드시 데이터를 스케일링 혹은 정규화를 해야할 것입니다. 딥러닝에서 기본적으로 이미지 데이터는 항상 normalize를 하는 편인데, 그 이유는 무엇일까요?
분류를 위한 데이터의 클래스는 대부분 카테고리 형태를 띕니다. 예를 들어, 동물 데이터의 클래스가 개,고양이,사자,뱀이 있다고 해봅시다. 머신러닝에서 학습을 진행하기 위해선 문자열 데이터를 사용하지 않고 주로 숫자형 데이터를 사용합니다. 따라서 우리는 “개,고양이,사자,뱀”을 숫자...
머신러닝에서 하이퍼 파라미터란 굉장히 중요한 요소 중 하나입니다. 예를 들어, 의사결정 트리를 사용한다고 했을때, 깊이를 얼만큼 할 것인지, 노드를 어떻게 할 것인지 같은게 있습니다. 하지만 어떤 하이퍼 파라미터 값이 가장 좋은지 바로 알 수 없습니다. 이것을 해결하기 위해 사이킷...
학습을 위해선 데이터 셋을 train set과 test set으로 나눠서 사용하는 것이 일반적입니다. 보통 비율을 7:3 혹은 8:2로 두죠.