Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | |||||
3 | 4 | 5 | 6 | 7 | 8 | 9 |
10 | 11 | 12 | 13 | 14 | 15 | 16 |
17 | 18 | 19 | 20 | 21 | 22 | 23 |
24 | 25 | 26 | 27 | 28 | 29 | 30 |
Tags
- 파이썬
- 딥러닝
- SQL
- IRIS
- tableau
- ML
- matplotlib
- 코딩테스트
- 통계
- 머신러닝
- sklearn
- 자격증
- 데이터 전처리
- ADsP
- 데이터분석준전문가
- SQLD
- pandas
- 이코테
- 데이터분석
- 이것이 코딩테스트다
- Google ML Bootcamp
- pytorch
- 회귀분석
- Deep Learning Specialization
- scikit learn
- r
- Python
- 시각화
- 태블로
- 데이터 분석
Archives
- Today
- Total
함께하는 데이터 분석
[ML] LightGBM 본문
LightGBM
LightGBM은 Gradient Boosting Machine에서 Light를 추가한 것입니다
Light가 붙은 만큼 속도도 빠르고 큰 사이즈의 데이터를 다룰 수 있고 실행시킬 때 적은 메모리를 차지합니다
추가로 LightGBM은 GPU 학습을 지원하고 결과의 정확도에 초점을 맞추므로 인기 있는 모델입니다
LightGBM은 기본적으로 GBM의 학습방식의 틀린 부분에 가중치를 주며 진행하는 방식입니다
GBM에 대한 소개는 이전 포스팅을 참고하세요
2023.01.15 - [데이터분석 공부/ML | DL] - [ML] Gradient Boosting Machine
따라서 일반적인 tree기반 모델이 level-wise로 수평적으로 확장되는 반면
LightGBM은 GBM과 똑같이 leaf-wise로 수직적으로 확장됩니다
최대 손실 값(max_data_loss)을 가지는 리프 노드를 지속적으로 분할하여
트리의 깊이가 깊어지고 비대칭적인 tree가 완성됩니다
LightGBM을 사용하실 때 유의해야 할 점은 overfitting에 민감합니다
규제 하이퍼파라미터가 존재하지 않아 작은 데이터로 사용하는 것은 좋지 않습니다
데이터는 대략 10000개 이상의 row를 가진 데이터에 사용하는 것이 좋습니다
Python 실습
import numpy as np
import warnings
warnings.filterwarnings('ignore')
from sklearn.datasets import load_iris
iris = load_iris()
X, y = iris['data'], (iris['target'] == 2).astype(np.float64)
from sklearn.model_selection import train_test_split
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=124)
from lightgbm import LGBMClassifier
model = LGBMClassifier(random_state=42)
model.fit(X_train, y_train)
pred = model.predict(X_test)
from sklearn.metrics import accuacy_score
print('LightGBM accuracy : ', round(accuracy_score(y_test, pred) * 100, 2))
>>> LightGBM Accuracy : 90.0
'데이터분석 공부 > ML | DL' 카테고리의 다른 글
[ML] CatBoost (0) | 2023.01.23 |
---|---|
[ML] XGBoost (0) | 2023.01.20 |
[ML] 분류 모델 성능 평가 지표 (0) | 2023.01.17 |
[ML] Gradient Boosting Machine (0) | 2023.01.15 |
[ML] 교차검증과 하이퍼파라미터 튜닝 (2) | 2023.01.14 |