함께하는 데이터 분석

[Python] get_dummies() 본문

데이터분석 공부/Python

[Python] get_dummies()

JEONGHEON 2022. 10. 13. 11:22

라이브러리 불러오기

import pandas as pd
import seaborn as sns

 

Seaborn을 활용하여 데이터 불러오기

mpg = sns.load_dataset('mpg')

mpg.head()

 

mpg=mpg.drop(columns='name')

mpg.head()

 

 

mpg['origin'].value_counts()

>>> usa       249
    japan      79
    europe     70
    Name: origin, dtype: int64

usa, japan, europe 3개의 값으로 origin 칼럼이 구성되어있음

 

 

get_dummies()

pd.get_dummies(mpg)

get_dummies()를 사용하여 간단하게 One-Hot Encoding을 한 것을 확인할 수 있음

 

결측 값이 존재한다면 dummy_na=True 옵션을 사용하면 NaN열도 생성됨