일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | ||||||
2 | 3 | 4 | 5 | 6 | 7 | 8 |
9 | 10 | 11 | 12 | 13 | 14 | 15 |
16 | 17 | 18 | 19 | 20 | 21 | 22 |
23 | 24 | 25 | 26 | 27 | 28 |
- IRIS
- 코딩테스트
- 데이터 전처리
- 머신러닝
- sklearn
- r
- 파이썬
- SQL
- 이것이 코딩테스트다
- 데이터분석
- Python
- SQLD
- 데이터분석준전문가
- 통계
- Deep Learning Specialization
- pytorch
- 자격증
- 데이터 분석
- scikit learn
- 회귀분석
- ML
- Google ML Bootcamp
- 딥러닝
- pandas
- tableau
- 태블로
- matplotlib
- 이코테
- ADsP
- 시각화
- Today
- Total
목록데이터분석 공부/Python (20)
함께하는 데이터 분석
![](http://i1.daumcdn.net/thumb/C150x150.fwebp.q85/?fname=https://blog.kakaocdn.net/dn/djWGKh/btrOrgOijkF/cujPk9khszN98pkQ1F8vy0/img.png)
라이브러리 불러오기 import pandas as pd import seaborn as sns Seaborn을 활용하여 데이터 불러오기 mpg = sns.load_dataset('mpg') mpg.head() mpg=mpg.drop(columns='name') mpg.head() mpg['origin'].value_counts() >>> usa 249 japan 79 europe 70 Name: origin, dtype: int64 usa, japan, europe 3개의 값으로 origin 칼럼이 구성되어있음 get_dummies() pd.get_dummies(mpg) get_dummies()를 사용하여 간단하게 One-Hot Encoding을 한 것을 확인할 수 있음 결측 값이 존재한다면 dummy_..
![](http://i1.daumcdn.net/thumb/C150x150.fwebp.q85/?fname=https://blog.kakaocdn.net/dn/Js0D6/btrLntoArlk/xKDZJOb4w7XeNFcjaUhgak/img.png)
csv와 tsv의 차이 csv : 콤마로 텍스트를 구분 tsv : 탭으로 텍스트를 구분 종류 excel csv(comma separated value) tsv(tab separated value) seperator , \t 불러오기 read_excel read_csv(sep=',') read_csv(sep='\t') excel 파일 불러오기 import pandas as pd # 판다스 라이브러리 불러오기 pd.read_excel('저장된 경로/저장된 파일명.xlsx') csv 파일 불러오기 import pandas as pd # 판다스 라이브러리 불러오기 pd.read_csv('저장된 경로/저장된 파일명.csv', sep=',') # separator 생략 가능 pd.read_csv('저장된 경로/저장..
![](http://i1.daumcdn.net/thumb/C150x150.fwebp.q85/?fname=https://blog.kakaocdn.net/dn/bp1EsZ/btrzoOZ5SLr/jxORv0lNlnUuXjFYJsIKUK/img.png)
오늘은 matplotlib의 subplots를 이용하여 여러 개의 그래프를 한 번에 그려보도록 하겠습니다. 그래프는 이전에 그렸던 그래프들을 그대로 가져와 보겠습니다. 시작해볼게요! 라이브러리 불러오기 import matplotlib.pyplot as plt plt.rc('font', family = 'AppleGothic') # mac # plt.rc('font', family = 'Malgun Gothic') # window plt.rc('font', size = 12) plt.rc('axes', unicode_minus = False) # -표시 오류 잡아줌 데이터 불러오기 science = ['physics', 'chemistry', 'life', 'earth'] people = [6.8, 8.0..
![](http://i1.daumcdn.net/thumb/C150x150.fwebp.q85/?fname=https://blog.kakaocdn.net/dn/WFz1c/btrzbd0vJu8/XulYGvJL0RtBfkHfGN3Tl1/img.png)
이번에는 matplotlib을 통하여 violinplot을 그려보겠습니다. 데이터는 boxplot에서 쓴 iris데이터를 사용하겠습니다. 같은 데이터로 그래프를 그리면 차이점을 명확히 느낄 수 있겠죠? 시작해보겠습니다. 라이브러리 불러오기 import matplotlib.pyplot as plt import seaborn as sns import numpy as np plt.rc('font', family = 'AppleGothic') # mac # plt.rc('font', family = 'Malgun Gothic') # window plt.rc('font', size = 12) plt.rc('axes', unicode_minus = False) # -표시 오류 잡아줌 데이터 불러오기 iris = s..
![](http://i1.daumcdn.net/thumb/C150x150.fwebp.q85/?fname=https://blog.kakaocdn.net/dn/uem2O/btry4fcUyAo/EjSXIOPlmpK8k95G7G6ukk/img.png)
오늘은 matplotlib을 이용하여 boxplot을 그리는 법을 알아보겠습니다. 라이브러리 불러오기 import matplotlib.pyplot as plt import seaborn as sns import numpy as np plt.rc('font', family = 'AppleGothic') # mac # plt.rc('font', family = 'Malgun Gothic') # window plt.rc('font', size = 12) plt.rc('axes', unicode_minus = False) # -표시 오류 잡아줌 matplotlib은 boxplot을 그릴 때 사용할 것이고 seaborn은 우리가 사용할 데이터를 불러올 때 사용할 것입니다. numpy는 index를 넣어줄 때 사용..
![](http://i1.daumcdn.net/thumb/C150x150.fwebp.q85/?fname=https://blog.kakaocdn.net/dn/H7Siy/btryQo1LFvo/iCkCuzhkZyqNLDAMwPa05k/img.png)
오늘은 파이 차트를 그려보겠습니다. 라이브러리 불러오기 import matplotlib.pyplot as plt plt.rc('font', family = 'AppleGothic') # mac # plt.rc('font', family = 'Malgun Gothic') # window plt.rc('font', size = 12) plt.rc('axes', unicode_minus = False) # -표시 오류 잡아줌 데이터 생성 및 파이 차트 그리기 science = ['physics', 'chemistry', 'life', 'earth'] people = [6.8, 8.0, 14.7, 14.9] plt.figure(figsize = (10, 5)) plt.pie(people, labels = sci..
![](http://i1.daumcdn.net/thumb/C150x150.fwebp.q85/?fname=https://blog.kakaocdn.net/dn/whnVO/btryRumpdmI/6Fjc6VcV5IhZSPLFy7UKyk/img.png)
오늘은 저번 포스트에서 말씀드린 대로 다중 막대그래프를 그리는 법을 간단히 알아보겠습니다. 라이브러리 불러오기 import numpy as np import pandas as pd import matplotlib.pyplot as plt plt.rc('font', family = 'AppleGothic') # mac # plt.rc('font', family = 'Malgun Gothic') # window plt.rc('font', size = 12) plt.rc('axes', unicode_minus = False) # -표시 오류 잡아줌 저번 시간과 다른 점은 numpy를 라이브러리를 사용해야 돼서 numpy를 np로 불러왔습니다 데이터 생성 # 년도 year = [2018, 2019, 2020, ..
![](http://i1.daumcdn.net/thumb/C150x150.fwebp.q85/?fname=https://blog.kakaocdn.net/dn/cBhSTQ/btryxb9qDZo/85dFYwYiQVh0Wz5l9rPyak/img.png)
오늘은 matplotlib을 활용하여 누적 막대그래프를 그려보도록 하겠습니다. 데이터는 저번과 같이 학년도 별 수능 과학탐구 응시자 수 데이터를 이용해보겠습니다. 라이브러리 불러오기 import matplotlib.pyplot as plt import pandas as pd plt.rc('font', family = 'AppleGothic') # mac # plt.rc('font', family = 'Malgun Gothic') # window plt.rc('font', size = 12) plt.rc('axes', unicode_minus = False) # -표시 오류 잡아줌 데이터 생성 # 년도 year = [2018, 2019, 2020, 2021, 2022] # 만명 단위 physics = [6..
![](http://i1.daumcdn.net/thumb/C150x150.fwebp.q85/?fname=https://blog.kakaocdn.net/dn/40qiL/btrytkEjf2m/4lfkqKXUF0JAoit06KJDsk/img.png)
오늘은 matplotlib을 이용하여 막대그래프를 그려보겠습니다. 저번 시간에 활용했던 수능 과학탐구 응시자 수에서 가장 최근인 2022년 데이터를 활용하겠습니다. 라이브러리 불러오기 import matplotlib.pyplot as plt plt.rc('font', family = 'AppleGothic') # mac # plt.rc('font', family = 'Malgun Gothic') # window plt.rc('font', size = 12) plt.rc('axes', unicode_minus = False) # -표시 오류 잡아줌 수능 과학탐구 응시자 수 리스트 science = ['physics', 'chemistry', 'life', 'earth'] people = [6.8, 8.0,..
![](http://i1.daumcdn.net/thumb/C150x150.fwebp.q85/?fname=https://blog.kakaocdn.net/dn/dxgKOH/btrx8MHL47N/Pj5IWciZguzf0fg5DKaxd1/img.png)
오늘은 Maplotlib을 이용하여 산점도 그래프를 그려보겠습니다. 라이브러리 불러오기 import numpy as np import pandas as pd import matplotlib.pyplot as plt plt.rc('font', family = 'AppleGothic') # mac # plt.rc('font', family = 'Malgun Gothic') # window plt.rc('font', size = 12) plt.rc('axes', unicode_minus = False) # -표시 오류 잡아줌 데이터 불러오기 import seaborn as sns iris = sns.load_dataset('iris') 이번에는 seaborn에 내장되어있는 데이터인 iris데이터를 이용하여 산..