일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | ||||||
2 | 3 | 4 | 5 | 6 | 7 | 8 |
9 | 10 | 11 | 12 | 13 | 14 | 15 |
16 | 17 | 18 | 19 | 20 | 21 | 22 |
23 | 24 | 25 | 26 | 27 | 28 |
- ADsP
- 데이터분석준전문가
- 파이썬
- 딥러닝
- Python
- 머신러닝
- SQLD
- sklearn
- 회귀분석
- 통계
- r
- SQL
- tableau
- matplotlib
- 데이터 분석
- pytorch
- 코딩테스트
- 데이터 전처리
- Google ML Bootcamp
- 이것이 코딩테스트다
- 데이터분석
- IRIS
- 태블로
- 시각화
- pandas
- 자격증
- Deep Learning Specialization
- scikit learn
- 이코테
- ML
- Today
- Total
목록pandas (8)
함께하는 데이터 분석
![](http://i1.daumcdn.net/thumb/C150x150.fwebp.q85/?fname=https://blog.kakaocdn.net/dn/djWGKh/btrOrgOijkF/cujPk9khszN98pkQ1F8vy0/img.png)
라이브러리 불러오기 import pandas as pd import seaborn as sns Seaborn을 활용하여 데이터 불러오기 mpg = sns.load_dataset('mpg') mpg.head() mpg=mpg.drop(columns='name') mpg.head() mpg['origin'].value_counts() >>> usa 249 japan 79 europe 70 Name: origin, dtype: int64 usa, japan, europe 3개의 값으로 origin 칼럼이 구성되어있음 get_dummies() pd.get_dummies(mpg) get_dummies()를 사용하여 간단하게 One-Hot Encoding을 한 것을 확인할 수 있음 결측 값이 존재한다면 dummy_..
![](http://i1.daumcdn.net/thumb/C150x150.fwebp.q85/?fname=https://blog.kakaocdn.net/dn/Js0D6/btrLntoArlk/xKDZJOb4w7XeNFcjaUhgak/img.png)
csv와 tsv의 차이 csv : 콤마로 텍스트를 구분 tsv : 탭으로 텍스트를 구분 종류 excel csv(comma separated value) tsv(tab separated value) seperator , \t 불러오기 read_excel read_csv(sep=',') read_csv(sep='\t') excel 파일 불러오기 import pandas as pd # 판다스 라이브러리 불러오기 pd.read_excel('저장된 경로/저장된 파일명.xlsx') csv 파일 불러오기 import pandas as pd # 판다스 라이브러리 불러오기 pd.read_csv('저장된 경로/저장된 파일명.csv', sep=',') # separator 생략 가능 pd.read_csv('저장된 경로/저장..
![](http://i1.daumcdn.net/thumb/C150x150.fwebp.q85/?fname=https://blog.kakaocdn.net/dn/bJ2uWE/btrwooIJ4of/iWVXkjAbSWhKa83UulW5A1/img.png)
안녕하세요! 이번에는 Python에서 Seaborn을 활용하여 범주형 변수의 시각화를 공부해보겠습니다. 라이브러리 실행 import numpy as np import pandas as pd import seaborn as sns 데이터 불러오기 mpg = sns.load_dataset('mpg') 1개의 범주형 변수에 대한 시각화 sns.countplot(data = mpg, x='origin') countplot은 x나 y에 하나의 범주형 변수만 넣으면 나머지는 개수로 표현됩니다. sns.countplot(data = mpg, y='origin') mpg['origin'].value_counts() >>> usa 249 japan 79 europe 70 Name: origin, dtype: int64 ..
![](http://i1.daumcdn.net/thumb/C150x150.fwebp.q85/?fname=https://blog.kakaocdn.net/dn/cph0V6/btrwiyzOiux/yYe6tR5NuAGHzfkMClq190/img.png)
안녕하세요! 오늘은 Python에서 Seaborn을 이용하여 수치형 변수의 시각화를 공부해보겠습니다. Seaborn은 Matplotlib보다 고수준으로 코드도 간단하고 미학적으로도 괜찮습니다. 그렇다면 Matplotlib보다 Seaborn이 좋다는 것일까요? 결론적으로는 두 가지 라이브러리를 다 사용할 줄 알아야 합니다. Matplotlib과 Seaborn을 같이 사용했을 때 Seaborn만을 사용했을 때 보다 더 좋은 결과물을 얻어낼 수 있습니다. 이처럼 결국에는 두 가지 라이브러리를 함께 사용하는 것이 효과적입니다. 그러면 오늘은 Seaborn을 이용하여 시각화를 시작해볼까요? 라이브러리 실행 import numpy as np import pandas as pd import seaborn as sns..
![](http://i1.daumcdn.net/thumb/C150x150.fwebp.q85/?fname=https://blog.kakaocdn.net/dn/AJZLv/btrrpEkx73P/k95mFh2LDBEWPeczXh8CZk/img.png)
저번에 다 작성하지 못했던 Pandas 라이브러리를 마무리하려고 합니다! 그럼 시작해볼까요? 5-1. 결측치 여부 확인 df2.isnull() df2.isnull().sum() # 각 열마다 결측치 개수 출력 >>> Name 0 Age 0 Score 0 Score2 2 dtype: int64 5-2. 결측치가 존재하는 행 삭제 df2.dropna(how = 'any') # how = 'all' : 행의 모든 값이 NaN인 경우 삭제 5-3. 결측치 대체 df2.fillna(value = 50.0) # 기본적으로 저장 X df2['Score2'].fillna({'two' : 68.0, 'five': 80.0}, inplace = True) # inplace = True : 저장 df2 6-1. 기술 통계 ..
![](http://i1.daumcdn.net/thumb/C150x150.fwebp.q85/?fname=https://blog.kakaocdn.net/dn/ccUYbY/btrrqLQPwka/huPmkPHqoqzQfoJgKn7piK/img.png)
오늘은 말씀드린 대로 NumPy에 이어서 Pandas 라이브러리에 대해 알아보겠습니다! Pandas 라이브러리는 대표적인 데이터 분석 라이브러리이며 행과 열로 이루어진 데이터 객체를 만들고 다룰 수 있어 안정적으로 대용량의 데이터를 처리하는 데 매우 편리하다는 장점이 있습니다. 이번에도 마찬가지로 주피터 노트북을 이용했으며 이용하고 싶으시다면 2022.01.22 - [데이터 분석 공부하기/Python] - [Python] Jupyter Notebook 설치 및 실행 [Python] Jupyter Notebook 설치 및 실행 오늘은 간단하게 Anaconda를 설치하여 주피터 노트북을 실행시키는 방법을 알아볼게요! 우선 아나콘다는 수학과 과학 분야에서 사용되는 여러 패키지들을 묶어 놓은 파이썬 배포판이고 ..
안녕하세요! 오늘은 파이썬에서 다차원 배열을 효과적으로 처리할 수 있고 수학 및 과학 연산에 유용한 NumPy 라이브러리에 대해 알아보려고 합니다. 우선 코딩은 주피터 노트북을 활용했습니다! 만약 주피터 노트북을 이용하고 싶으시다면 2022.01.22 - [데이터 분석 공부하기/Python] - [Python] Jupyter Notebook 설치 및 실행 [Python] Jupyter Notebook 설치 및 실행 오늘은 간단하게 Anaconda를 설치하여 주피터 노트북을 실행시키는 방법을 알아볼게요! 우선 아나콘다는 수학과 과학 분야에서 사용되는 여러 패키지들을 묶어 놓은 파이썬 배포판이고 대표적으 tnqkrdmssjan.tistory.com ^^^^ 여기를 눌러주시면 됩니다! 그럼 시작해볼게요~ 1...
![](http://i1.daumcdn.net/thumb/C150x150.fwebp.q85/?fname=https://blog.kakaocdn.net/dn/mR5yG/btrrqa95ElQ/tmQpwOgVQpvRhYKLSA4LXk/img.png)
오늘은 간단하게 Anaconda를 설치하여 주피터 노트북을 실행시키는 방법을 알아볼게요! 우선 아나콘다는 수학과 과학 분야에서 사용되는 여러 패키지들을 묶어 놓은 파이썬 배포판이고 대표적으로 NumPy, Pandas, Matplotlib 등을 비롯한 많은 패키지를 포함하고 있습니다. 최근 데이터 사이언스와 머신러닝 분야에서 파이썬을 사용하기 위해 설치를 하는 추세입니다! 웹 브라우저에서 작성할 수 있고 마크다운 사용으로 코드 및 주석을 깔끔하게 정리할 수 있다는 장점이 있습니다. 그럼 이제 설치하는 법을 알아볼까요? 우선 https://www.anaconda.com/ 에 들어가셔서 컴퓨터에 맞는 OS를 선택하여 다운받습니다. 설치하여 깔게 되면 Anaconda3 라는 폴더가 생성될 것입니다. 안에 보면 ..