데이터분석 공부/Python
[Python] get_dummies()
JEONGHEON
2022. 10. 13. 11:22
라이브러리 불러오기
import pandas as pd
import seaborn as sns
Seaborn을 활용하여 데이터 불러오기
mpg = sns.load_dataset('mpg')
mpg.head()
mpg=mpg.drop(columns='name')
mpg.head()
mpg['origin'].value_counts()
>>> usa 249
japan 79
europe 70
Name: origin, dtype: int64
usa, japan, europe 3개의 값으로 origin 칼럼이 구성되어있음
get_dummies()
pd.get_dummies(mpg)
get_dummies()를 사용하여 간단하게 One-Hot Encoding을 한 것을 확인할 수 있음
결측 값이 존재한다면 dummy_na=True 옵션을 사용하면 NaN열도 생성됨