일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | |||||
3 | 4 | 5 | 6 | 7 | 8 | 9 |
10 | 11 | 12 | 13 | 14 | 15 | 16 |
17 | 18 | 19 | 20 | 21 | 22 | 23 |
24 | 25 | 26 | 27 | 28 | 29 | 30 |
- ML
- sklearn
- 이것이 코딩테스트다
- r
- pandas
- 코딩테스트
- matplotlib
- pytorch
- 데이터분석준전문가
- SQLD
- 데이터 전처리
- scikit learn
- 딥러닝
- 머신러닝
- SQL
- 자격증
- 데이터분석
- 시각화
- 통계
- 태블로
- 파이썬
- Deep Learning Specialization
- 회귀분석
- 이코테
- Python
- tableau
- Google ML Bootcamp
- ADsP
- IRIS
- 데이터 분석
- Today
- Total
목록전체 글 (142)
함께하는 데이터 분석
안녕하세요! 오늘은 SQL 명령어 4가지 중 하나인 데이터 정의어(DDL)에 대해 알아보겠습니다. 데이터 정의어는 우리가 사용할 테이블을 생성, 변경, 삭제를 할 때 사용하는 명령어입니다. 코드를 통해 알아보겠습니다. 데이터 베이스 생성 및 사용 /* 데이터베이스 da 생성 */ create database da; 데이터 베이스 da가 생성된 것을 알 수 있습니다. 이 데이터 베이스 da에 테이블을 만들려면 데이터베이스를 사용해야겠죠? /* 데이터베이스 da 사용 */ use da; 데이터 베이스 da를 사용할 수 있게 되었습니다. 이제 테이블을 만들어보겠습니다. 테이블 생성 /* 테이블 생성 */ create table 인적사항 ( 인덱스 int primary key, 이름 varchar(10), 생년..
안녕하세요. 오늘은 mac에서 MySQL 및 Workbench를 설치하는 방법을 알아보겠습니다. 그럼 시작해볼까요? MySQL 설치하기 Google에서 mysql community download를 검색합니다. 흰색 화살표를 클릭하면 다음과 같은 화면이 나타납니다. 여기서 빨간색 화살표대로 MySQL Community Server를 클릭합니다. 여기서 just start my download를 클릭하면 밑에처럼 dmg파일이 다운로드됩니다. 이후 저 패키지를 열면 위와 같은 설치 파일이 열립니다. 계속을 계속 눌러주시면 Configuration에서 비밀번호를 설정하라고 합니다. 좀 이따 설치할 workbench에 접속할 때 사용됩니다. 비밀번호까지 설정하면 MySQL이 설치가 완료됩니다. 이제 Workbe..
오늘은 matplotlib의 subplots를 이용하여 여러 개의 그래프를 한 번에 그려보도록 하겠습니다. 그래프는 이전에 그렸던 그래프들을 그대로 가져와 보겠습니다. 시작해볼게요! 라이브러리 불러오기 import matplotlib.pyplot as plt plt.rc('font', family = 'AppleGothic') # mac # plt.rc('font', family = 'Malgun Gothic') # window plt.rc('font', size = 12) plt.rc('axes', unicode_minus = False) # -표시 오류 잡아줌 데이터 불러오기 science = ['physics', 'chemistry', 'life', 'earth'] people = [6.8, 8.0..
오늘은 R을 이용하여 simple linear regression을 알아보겠습니다. 데이터는 wages.Rdata를 사용했습니다. 데이터 불러오기 setwd("경로") load("wages.Rdata") attach(wages) setwd를 통하여 자신의 경로를 설정한 다음 load를 통해 경로 안에 있는 파일을 불러오면 됩니다. attach를 통하여 데이터를 불러옴으로써 data.frame에서 column을 wages$logwage가 아닌 logwage라고 쓸 수 있게 됩니다. 데이터 구조 파악하기 str(wages) >>> 'data.frame':2178 obs. of 2 variables: $ education: num 16.8 15 10 12.7 15 ... $ logwage : num 2.85 ..
이번에는 matplotlib을 통하여 violinplot을 그려보겠습니다. 데이터는 boxplot에서 쓴 iris데이터를 사용하겠습니다. 같은 데이터로 그래프를 그리면 차이점을 명확히 느낄 수 있겠죠? 시작해보겠습니다. 라이브러리 불러오기 import matplotlib.pyplot as plt import seaborn as sns import numpy as np plt.rc('font', family = 'AppleGothic') # mac # plt.rc('font', family = 'Malgun Gothic') # window plt.rc('font', size = 12) plt.rc('axes', unicode_minus = False) # -표시 오류 잡아줌 데이터 불러오기 iris = s..
오늘은 matplotlib을 이용하여 boxplot을 그리는 법을 알아보겠습니다. 라이브러리 불러오기 import matplotlib.pyplot as plt import seaborn as sns import numpy as np plt.rc('font', family = 'AppleGothic') # mac # plt.rc('font', family = 'Malgun Gothic') # window plt.rc('font', size = 12) plt.rc('axes', unicode_minus = False) # -표시 오류 잡아줌 matplotlib은 boxplot을 그릴 때 사용할 것이고 seaborn은 우리가 사용할 데이터를 불러올 때 사용할 것입니다. numpy는 index를 넣어줄 때 사용..
오늘은 파이 차트를 그려보겠습니다. 라이브러리 불러오기 import matplotlib.pyplot as plt plt.rc('font', family = 'AppleGothic') # mac # plt.rc('font', family = 'Malgun Gothic') # window plt.rc('font', size = 12) plt.rc('axes', unicode_minus = False) # -표시 오류 잡아줌 데이터 생성 및 파이 차트 그리기 science = ['physics', 'chemistry', 'life', 'earth'] people = [6.8, 8.0, 14.7, 14.9] plt.figure(figsize = (10, 5)) plt.pie(people, labels = sci..
오늘은 저번 포스트에서 말씀드린 대로 다중 막대그래프를 그리는 법을 간단히 알아보겠습니다. 라이브러리 불러오기 import numpy as np import pandas as pd import matplotlib.pyplot as plt plt.rc('font', family = 'AppleGothic') # mac # plt.rc('font', family = 'Malgun Gothic') # window plt.rc('font', size = 12) plt.rc('axes', unicode_minus = False) # -표시 오류 잡아줌 저번 시간과 다른 점은 numpy를 라이브러리를 사용해야 돼서 numpy를 np로 불러왔습니다 데이터 생성 # 년도 year = [2018, 2019, 2020, ..
이번에는 데이터 마이닝의 분석방법 중 하나인 연관성 분석을 알아보겠습니다. 연관성 분석의 정의 데이터 안에 존재하는 항목 간의 연관 규칙(association rule)을 발견하는 과정 마케팅에서 손님의 장바구니에 들어있는 품목 간의 관계를 알아본다는 의미에서 장바구니 분석이라고도 함 연관성 분석의 예시 - 가장 유명한 예시로 월마트의 맥주와 기저귀입니다. 아내의 부탁으로 기저귀를 사갈 때 맥주를 같이 사간다는 분석입니다. 연관성 규칙의 조건 두 품목(품목 A와 B)이 함께 구매한 경우의 수가 일정 수준 이상이어야 함(일정 이상의 지지도) 품목 A를 포함하는 거래 중 품목 B를 구입하는 경우의 수가 일정 수준 이상이어야 함(일정 이상의 신뢰도) 그렇다면 이번에는 지지도와 신뢰도 등, 연관성 분석의 평가 ..
오늘은 matplotlib을 활용하여 누적 막대그래프를 그려보도록 하겠습니다. 데이터는 저번과 같이 학년도 별 수능 과학탐구 응시자 수 데이터를 이용해보겠습니다. 라이브러리 불러오기 import matplotlib.pyplot as plt import pandas as pd plt.rc('font', family = 'AppleGothic') # mac # plt.rc('font', family = 'Malgun Gothic') # window plt.rc('font', size = 12) plt.rc('axes', unicode_minus = False) # -표시 오류 잡아줌 데이터 생성 # 년도 year = [2018, 2019, 2020, 2021, 2022] # 만명 단위 physics = [6..