본문 바로가기

Machine Learning3

Modeling 에서 중요한 것 1. 정확도 (결과 예측 정확도) 2. 시간 (학습 시간, 결과 출력 시간) 3. 메모리 사용량 4. 코드 가독성 5. 디버깅 6. 데이터의 퀄리티 따라서, 수없는 시행착오를 겪어보는것이 중요. 2022. 2. 18.
Overfitting / underfitting 해결 방법 overfitting 해결 방법 overfitting -> high variance 1. train more data 2. less features 3. regularization 1) early stopping : validation loss 가 더이상 낮아지지 않을때 2) reducing network size 3) weight decay 4) dropout layers 5) batch normalization. underfitting 해결 방법 underfitting -> high bias 1. more features 2. more traning time 3. more complex model 4. decision tree, knn, svm 2022. 2. 18.
사이킷런의 주요 모듈 사이킷런의 주요 모듈 sklearn major modules 분류 모듈명 설명 예제 데이터 sklearn.datasets 사이킷런에 내장되어 예제로 제공하는 데이터 세트. 피처 처리 sklearn.preprocessing 데이터 전처리에 필요한 다양한 가공 기능 제공 (문자열을 숫자 형 코드 값으로 인코딩, 정규화, 스케일링 등). sklearn.feature_selection 알고리즘에 큰 영향을 미치는 피처를 우선순위대로 셀렉션 작업을 수행하는 다양한 기능 제공. sklearn.feature_extraction 텍스트 데이터나 이미지 데이터의 백터화된 피처를 추출하는데 사용됨. 예를들어, 텍스트 데이터에서 count vectoirzer 나 Tf-Idf vectorizer 등을 생성하는데 기능 제공. .. 2022. 1. 13.