일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | ||||||
2 | 3 | 4 | 5 | 6 | 7 | 8 |
9 | 10 | 11 | 12 | 13 | 14 | 15 |
16 | 17 | 18 | 19 | 20 | 21 | 22 |
23 | 24 | 25 | 26 | 27 | 28 |
- Google ML Bootcamp
- 딥러닝
- Python
- r
- 코딩테스트
- 데이터분석준전문가
- pytorch
- 시각화
- 머신러닝
- 파이썬
- 데이터 분석
- 태블로
- tableau
- IRIS
- SQLD
- scikit learn
- 이코테
- 데이터 전처리
- matplotlib
- Deep Learning Specialization
- sklearn
- ML
- pandas
- 데이터분석
- SQL
- 통계
- 이것이 코딩테스트다
- 회귀분석
- 자격증
- ADsP
- Today
- Total
목록통계 (72)
함께하는 데이터 분석
오늘은 간단하게 이번 2월 26일 시험인 ADsP 기출을 풀다가 틀린 문제를 제가 다시 보려고 작성하는 오답노트라고 할 수 있겠습니다. 시작해볼게요! 반정형데이터 내부에 메타 데이터 갖고 있음 메타 데이터 데이터에 관한 구조화된 데이터로, 다른 데이터를 설명해주는 데이터 데이터 매시업(Mashup) 기존에 풀기 어려웠던 문제 해결에 도움 CRM 단순한 정보의 수집에서 탈피, 분석 중심의 시스템 구축 지향 ERP 기업 전체를 경영자원의 효과적 이용이라는 관점에서 통합적으로 관리하고 경영의 효율화를 기하기 위한 시스템 플랫폼형 비즈니스 모델 상품, 서비스, 기술 등의 기반 위에 다른 이해관계자들이 보완적인 상품, 서비스, 기술을 제공하는 생태계 구축을 목표로 하는 비즈니스 모델 데이터 난수화 사생활 침해 막..

안녕하세요. 오늘은 토픽모델링에 대해 알아볼게요. 우선 토픽모델링이란? 토픽 모델링(Topic Modeling)은 전체 내용물에서 일정한 패턴을 발견해 내는 알고리즘 기반 텍스트 마이닝(Text Mining)의 한 형태입니다. 위의 사진을 보면 노란색 박스에 분류된 그룹은 유전과 관련된 단어 핑크색 박스에 분류된 그룹은 생명 초록색 박스는 뇌과학, 하늘색 박스는 컴퓨터과학과 관련됐다고 유추할 수 있습니다! 그렇다면 우리는 R로 구현하여 위와 같이 만들어보겠습니다. 그중 LDA(Latent Dirichlet Allocation)를 활용해볼게요! # 패키지 설치 install.packages("topicmodels") install.packages("tidytext") install.packages("tid..

안녕하세요! 오늘은 Factor Analysis의 약자인 FA에 대해 알아보겠습니다. 파일은 저번이랑 똑같은 이 파일입니다. 만약 파일 정보가 필요하시다면 2022.02.06 - [분류 전체보기] - [EDA] PCA with R [EDA] PCA with R 오늘은 Principal Component Analysis 일명 PCA에 대해 간단한 예제를 R을 통해 알아보는 시간을 갖겠습니다! 그러기에 앞서 필요한 파일을 첨부하겠습니다. 위 데이터는 주식에 관한 10개 회사의 값입니 tnqkrdmssjan.tistory.com 여기서 확인해주세요! 그럼 시작하겠습니다. ### perfrom factor analysis with 3 factors but without any rotation kval>> Loa..

오늘은 Principal Component Analysis 일명 PCA에 대해 간단한 예제를 R을 통해 알아보는 시간을 갖겠습니다! 그러기에 앞서 필요한 파일을 첨부하겠습니다. 위 데이터는 주식에 관한 10개 회사의 값입니다. 그럼 시작해볼까요? rm(list=ls()) #할당변수 모두 제거 load("stockreturns.RData") #데이터 불러오기 ls() #변수 확인 >>> [1] "stocks" head(stocks) tail(stocks) str(stocks) #구조 파악 >>> 'data.frame':100 obs. of 10 variables: $ comp1 : num 0.44781 0.98811 0.87456 0.7144 0.00535 ... $ comp2 : num 0.0673 1...

안녕하세요! 오늘은 Singular Value Decomposition의 약자인 SVD에 대해 R을 통해 알아보겠습니다. 우선 코딩에 필요한 파일을 올려놨습니다. 그럼 시작해볼게요! load("face.rda") #파일 불러오기 image(t(faceData)[, nrow(faceData):1]) svd1$d #singular value >>> [1] 1.977887e+01 1.513802e+01 1.213935e+01 8.427234e+00 6.200006e+00 [6] 4.936858e+00 4.402278e+00 3.967227e+00 3.743197e+00 3.017167e+00 [11] 2.967196e+00 2.406314e+00 1.899693e+00 1.555837e+00 1.492379e..

1과목 마지막인 3장을 공부해볼게요! 3장_1절 빅데이터 분석과 전략 인사이트 1. 빅데이터 회의론의 원인 부정적 학습효과 -> 과거의 고객관계관리(CRM) : 공포 마케팅, 투자 대비 효과 미흡 부적절한 성공사례 -> 빅데이터가 필요 없는 분석사례, 기존 CRM의 분석 성과를 빅데이터 분석 성과로 과대 포장 즉, 단순히 빅데이터에 포커스를 두지 말고, 분석을 통해 가치를 만드는 것에 집중해야 함 2. 일차원적인 분석 vs 전략 도출을 위한 가치 기반 분석 1) 산업별 분석 애플리케이션 산업 일차원적 분석 애플리케이션 금융 서비스 신용점수 산정, 사기 탐지, 가격 책정, 프로그램 트레이딩, 클레임 분석, 고객 수익성 분석 병원 가격 책정, 고객 로열티, 수익 관리 에너지 트레이딩, 공급, 수요 예측 정부..
ADsP 1과목 2장을 공부하고 요약했습니다. 다시 한번 이 시험의 정보는 이전 블로그에 발행한 2021.12.21 - [분류 전체보기] - [ADsP] ADsP 자격증 함께 취득해요! [ADsP] ADsP 자격증 함께 취득해요! 이번에 ADsP 2022년 첫 시험을 보려고 하는데요! 제가 보는 시험 일정입니다! 같이 신청하고 공부해요!! 이제 제가 구입한 책을 소개해드리겠습니다. 인터넷 검색했을때 가장 많이 보이는 일명 파 tnqkrdmssjan.tistory.com 여기를 참고해 주시고 이제 시작할게요! 2장_1절 빅데이터의 이해 1. 빅데이터의 정의 1) 관점에 따른 정의 Mckinsey,(2011) IDC(2011) 가트너 그룹(Gartner Group) 더그 래니(Doug Laney)의 3V 일..

오늘은 ADsP를 공부하고 요약해보는 시간을 갖겠습니다! 제가 보는 시험의 정보는 바로 2021.12.21 - [분류 전체보기] - [ADsP] ADsP 자격증 함께 취득해요! [ADsP] ADsP 자격증 함께 취득해요! 이번에 ADsP 2022년 첫 시험을 보려고 하는데요! 제가 보는 시험 일정입니다! 같이 신청하고 공부해요!! 이제 제가 구입한 책을 소개해드리겠습니다. 인터넷 검색했을때 가장 많이 보이는 일명 파 tnqkrdmssjan.tistory.com 여기에 있으니 참고해주시고 이제 시작하겠습니다. 1장_1절 데이터와 정보 1. 데이터의 유형 정성적 데이터(qualitative data) : 저장, 검색, 분석에 많은 비용이 소모되는 언어. 문자 형태의 데이터(ex : 회사 매출이 증가함) 정량..

안녕하세요! 오늘은 EDA수업에서 배우는 또 다른 Clustering 기법인 k-means clustering을 R을 통해 알아보겠습니다. 간단한 좌표 설정 set.seed(1234) #rnorm으로 생성된 값 계속쓰기 위해 고정 x >> [1] 3 3 3 3 1 1 1 1 2 2 2 2 points(x, y, col = kmeansObj$cluster, pch = 19, cex = 2) image() 이용하기 par(mfrow=c(1,2)) #그래픽 1행 2열로 보이게 image(t(dataFrame)[, nrow(dataFrame):1], yaxt = "n", main = "Original Data") image(t(dataFrame)[, order(kmeansObj$cluster)], yaxt = ..