일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | ||||||
2 | 3 | 4 | 5 | 6 | 7 | 8 |
9 | 10 | 11 | 12 | 13 | 14 | 15 |
16 | 17 | 18 | 19 | 20 | 21 | 22 |
23 | 24 | 25 | 26 | 27 | 28 |
- 머신러닝
- 데이터 전처리
- 시각화
- 자격증
- 회귀분석
- ML
- 데이터 분석
- SQL
- sklearn
- IRIS
- Deep Learning Specialization
- 파이썬
- 딥러닝
- tableau
- r
- ADsP
- Python
- scikit learn
- SQLD
- 통계
- 이것이 코딩테스트다
- pandas
- 태블로
- 코딩테스트
- matplotlib
- Google ML Bootcamp
- 데이터분석
- 이코테
- 데이터분석준전문가
- pytorch
- Today
- Total
목록통계 (72)
함께하는 데이터 분석

안녕하세요! 오늘은 SQL 명령어 4가지 중 하나인 데이터 정의어(DDL)에 대해 알아보겠습니다. 데이터 정의어는 우리가 사용할 테이블을 생성, 변경, 삭제를 할 때 사용하는 명령어입니다. 코드를 통해 알아보겠습니다. 데이터 베이스 생성 및 사용 /* 데이터베이스 da 생성 */ create database da; 데이터 베이스 da가 생성된 것을 알 수 있습니다. 이 데이터 베이스 da에 테이블을 만들려면 데이터베이스를 사용해야겠죠? /* 데이터베이스 da 사용 */ use da; 데이터 베이스 da를 사용할 수 있게 되었습니다. 이제 테이블을 만들어보겠습니다. 테이블 생성 /* 테이블 생성 */ create table 인적사항 ( 인덱스 int primary key, 이름 varchar(10), 생년..

오늘은 matplotlib의 subplots를 이용하여 여러 개의 그래프를 한 번에 그려보도록 하겠습니다. 그래프는 이전에 그렸던 그래프들을 그대로 가져와 보겠습니다. 시작해볼게요! 라이브러리 불러오기 import matplotlib.pyplot as plt plt.rc('font', family = 'AppleGothic') # mac # plt.rc('font', family = 'Malgun Gothic') # window plt.rc('font', size = 12) plt.rc('axes', unicode_minus = False) # -표시 오류 잡아줌 데이터 불러오기 science = ['physics', 'chemistry', 'life', 'earth'] people = [6.8, 8.0..

오늘은 R을 이용하여 simple linear regression을 알아보겠습니다. 데이터는 wages.Rdata를 사용했습니다. 데이터 불러오기 setwd("경로") load("wages.Rdata") attach(wages) setwd를 통하여 자신의 경로를 설정한 다음 load를 통해 경로 안에 있는 파일을 불러오면 됩니다. attach를 통하여 데이터를 불러옴으로써 data.frame에서 column을 wages$logwage가 아닌 logwage라고 쓸 수 있게 됩니다. 데이터 구조 파악하기 str(wages) >>> 'data.frame':2178 obs. of 2 variables: $ education: num 16.8 15 10 12.7 15 ... $ logwage : num 2.85 ..

이번에는 matplotlib을 통하여 violinplot을 그려보겠습니다. 데이터는 boxplot에서 쓴 iris데이터를 사용하겠습니다. 같은 데이터로 그래프를 그리면 차이점을 명확히 느낄 수 있겠죠? 시작해보겠습니다. 라이브러리 불러오기 import matplotlib.pyplot as plt import seaborn as sns import numpy as np plt.rc('font', family = 'AppleGothic') # mac # plt.rc('font', family = 'Malgun Gothic') # window plt.rc('font', size = 12) plt.rc('axes', unicode_minus = False) # -표시 오류 잡아줌 데이터 불러오기 iris = s..

오늘은 matplotlib을 이용하여 boxplot을 그리는 법을 알아보겠습니다. 라이브러리 불러오기 import matplotlib.pyplot as plt import seaborn as sns import numpy as np plt.rc('font', family = 'AppleGothic') # mac # plt.rc('font', family = 'Malgun Gothic') # window plt.rc('font', size = 12) plt.rc('axes', unicode_minus = False) # -표시 오류 잡아줌 matplotlib은 boxplot을 그릴 때 사용할 것이고 seaborn은 우리가 사용할 데이터를 불러올 때 사용할 것입니다. numpy는 index를 넣어줄 때 사용..

오늘은 파이 차트를 그려보겠습니다. 라이브러리 불러오기 import matplotlib.pyplot as plt plt.rc('font', family = 'AppleGothic') # mac # plt.rc('font', family = 'Malgun Gothic') # window plt.rc('font', size = 12) plt.rc('axes', unicode_minus = False) # -표시 오류 잡아줌 데이터 생성 및 파이 차트 그리기 science = ['physics', 'chemistry', 'life', 'earth'] people = [6.8, 8.0, 14.7, 14.9] plt.figure(figsize = (10, 5)) plt.pie(people, labels = sci..

오늘은 저번 포스트에서 말씀드린 대로 다중 막대그래프를 그리는 법을 간단히 알아보겠습니다. 라이브러리 불러오기 import numpy as np import pandas as pd import matplotlib.pyplot as plt plt.rc('font', family = 'AppleGothic') # mac # plt.rc('font', family = 'Malgun Gothic') # window plt.rc('font', size = 12) plt.rc('axes', unicode_minus = False) # -표시 오류 잡아줌 저번 시간과 다른 점은 numpy를 라이브러리를 사용해야 돼서 numpy를 np로 불러왔습니다 데이터 생성 # 년도 year = [2018, 2019, 2020, ..

이번에는 데이터 마이닝의 분석방법 중 하나인 연관성 분석을 알아보겠습니다. 연관성 분석의 정의 데이터 안에 존재하는 항목 간의 연관 규칙(association rule)을 발견하는 과정 마케팅에서 손님의 장바구니에 들어있는 품목 간의 관계를 알아본다는 의미에서 장바구니 분석이라고도 함 연관성 분석의 예시 - 가장 유명한 예시로 월마트의 맥주와 기저귀입니다. 아내의 부탁으로 기저귀를 사갈 때 맥주를 같이 사간다는 분석입니다. 연관성 규칙의 조건 두 품목(품목 A와 B)이 함께 구매한 경우의 수가 일정 수준 이상이어야 함(일정 이상의 지지도) 품목 A를 포함하는 거래 중 품목 B를 구입하는 경우의 수가 일정 수준 이상이어야 함(일정 이상의 신뢰도) 그렇다면 이번에는 지지도와 신뢰도 등, 연관성 분석의 평가 ..

오늘은 matplotlib을 활용하여 누적 막대그래프를 그려보도록 하겠습니다. 데이터는 저번과 같이 학년도 별 수능 과학탐구 응시자 수 데이터를 이용해보겠습니다. 라이브러리 불러오기 import matplotlib.pyplot as plt import pandas as pd plt.rc('font', family = 'AppleGothic') # mac # plt.rc('font', family = 'Malgun Gothic') # window plt.rc('font', size = 12) plt.rc('axes', unicode_minus = False) # -표시 오류 잡아줌 데이터 생성 # 년도 year = [2018, 2019, 2020, 2021, 2022] # 만명 단위 physics = [6..

오늘은 simple linear regression에서 검정(test)을 공부해보겠습니다. 귀무가설 대립가설 세우기 우리는 simple linear regression에서 β_0인 intercept 부분보다 β_1인 기울기 부분에 관심이 있습니다. 그래서 귀무가설에 β_1 = 0을 놓고 우리가 궁금해하는 대립가설에 β_1 =/ 0으로 설정했습니다. 일반적인 가설검정이라고 볼 수 있죠. 그런데 저번 포스트에서 M_0 모델과 M_1 모델을 살펴본 것이 기억나세요? 모델의 관점에서 M_0 모델이 옳은가, M_1 모델이 옳은가로 가설검정을 세우면 위의 기울기의 관점과 동치가 됩니다. M_0 모델은 x_i인 설명변수가 없는 모델이지만 M_1 모델에서 β_1이 0이 되면 x_i가 의미가 없어지기 때문이죠. 그렇다면..