728x90
사이킷런의 주요 모듈
sklearn major modules
| 분류 | 모듈명 | 설명 |
| 예제 데이터 | sklearn.datasets | 사이킷런에 내장되어 예제로 제공하는 데이터 세트. |
| 피처 처리 | sklearn.preprocessing | 데이터 전처리에 필요한 다양한 가공 기능 제공 (문자열을 숫자 형 코드 값으로 인코딩, 정규화, 스케일링 등). |
| sklearn.feature_selection | 알고리즘에 큰 영향을 미치는 피처를 우선순위대로 셀렉션 작업을 수행하는 다양한 기능 제공. | |
| sklearn.feature_extraction | 텍스트 데이터나 이미지 데이터의 백터화된 피처를 추출하는데 사용됨. 예를들어, 텍스트 데이터에서 count vectoirzer 나 Tf-Idf vectorizer 등을 생성하는데 기능 제공. 텍스트 데이터의 피처 추출은 sklearn.feature_extraction.image 모듈에 지원 API가 있음. |
|
| 피처 처리 & 차원 축소 | sklearn.decomposition | 차원 축소와 관련한 알고리즘을 지원하는 모듈. PCA, NMP, Truncated SVD 등을 통해 차원 축소 기능을 수행함. |
| 데이터 분리, 검층, 파라미터 튜닝 | sklearn.model_selection | 교차 검증을 위한 학습용/데이터용 분리 그리드 서리(Grid Search) 로 최적의 파라미터 추출 등의 API 제공. |
| 평가 | sklearn.metrics | 분류, 회귀, 클러스터링, 페어와이즈(Pairwise)에 대한 다양한 성능 측정 방법 제공. Accuracy, Precision, Recall, ROC-AUC, RMSE 등 제공. |
| ML 알고리즘 | sklearn.ensemble | 앙상블 알고리즘 제공. 렌덤 포레스트, 에이다 부스트, 그래디언트 부스팅 등을 제공. |
| sklearn.linear_model | 주로 선형 회귀, 랏지(Ridge), 라쏘(Lasso) 및 로지스틱 회귀 등 회귀 관련 알고리즘을 지원. SGD(Stochastic Gradient Descent 관련 알고리즘도 제공. |
|
| sklearn.naive_bayes | 나이브 베이즈 알고리즘 제공. 가우시안 NB. 다항 분포 NB 제공. |
|
| sklearn.neighbors | K-NN 최근접 이웃 알고리즘 제공. | |
| sklearn.svm | 서포트 백터 머신 알고리즘 제공. | |
| sklearn.tree | 의사 결정 트리 알고리즘 제공. | |
| sklearn.cluster | 비지도 클러스터링 알고리즘 제공. (K-평균, 계층형, DBSCAN 등) |
|
| 유틸리티 | sklearn.pipeline | 피처 처리 등의 변환과 ML 알고리즘 학습, 예측 등을 함께 묶어서 실행 할 수 있는 유틸리티 제공. |
Reference
1.https://scikit-learn.org/stable/modules/classes.html
API Reference
This is the class and function reference of scikit-learn. Please refer to the full user guide for further details, as the class and function raw specifications may not be enough to give full guidel...
scikit-learn.org
2. 파이썬 머신러닝 완벽가이드 위키북스 데이터 사이언스 시리즈
'Machine Learning' 카테고리의 다른 글
| Modeling 에서 중요한 것 (0) | 2022.02.18 |
|---|---|
| Overfitting / underfitting 해결 방법 (1) | 2022.02.18 |