일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | ||||
4 | 5 | 6 | 7 | 8 | 9 | 10 |
11 | 12 | 13 | 14 | 15 | 16 | 17 |
18 | 19 | 20 | 21 | 22 | 23 | 24 |
25 | 26 | 27 | 28 | 29 | 30 | 31 |
- IRIS
- Deep Learning Specialization
- 자격증
- 딥러닝
- ADsP
- SQLD
- Python
- 회귀분석
- 데이터 전처리
- matplotlib
- 시각화
- 이것이 코딩테스트다
- pytorch
- pandas
- ML
- scikit learn
- tableau
- Google ML Bootcamp
- 통계
- 데이터분석준전문가
- 머신러닝
- 태블로
- r
- SQL
- 데이터분석
- 데이터 분석
- 이코테
- 코딩테스트
- 파이썬
- sklearn
- Today
- Total
목록NLP (4)
함께하는 데이터 분석

Positional Encoding 앞서 포스팅한 Transformer① 모델에서 한 가지 부족한 부분은 입력 문장에서 단어들의 순서를 고려하지 않았다는 것 이것을 추가하기 위해 Transformer 모델은 각각의 입력 임베딩에 "positional encoding"이라고 불리는 하나의 벡터를 추가 이 벡터들은 모델이 학습하는 특정한 패턴을 따르는데, 이 패턴은 모델이 각 단어의 위치와 시퀀스 내의 다른 단어 간의 위치 차이에 대한 정보를 알 수 있게 해 줌 이 벡터들을 추가하기로 한 배경에는 이 값들을 단어들의 임베딩에 추가하는 것이 query/key/value 벡터들로 나중에 투영되었을 때 단어들 간의 거리를 늘릴 수 있다는 점 모델에게 단어의 순서에 대한 정보를 주기 위해, 위치 별로 특정한 패턴을..

Transformer 2017 NIPS에서 Google이 소개 CNN이나 RNN이 주를 이루었던 연구들에서 벗어난 아예 새로운 모델이고 실제 적용했을 때 큰 성능 향상을 보임 multi-head self-attention을 이용해 sequential computation을 줄여 더 많은 부분을 병렬처리가 가능하며 더 많은 단어들 간의 dependency를 모델링 함 이를 하나의 black box라고 보면 어떤 한 언어로 된 하나의 문장을 입력으로 받아 다른 언어로 된 번역을 출력으로 내놓음 black box를 열어보면 우리는 인코딩 부분, 디코딩 부분 그리고 그 사이를 이어주는 connection들을 보게 됨 인코딩 부분은 여러 개의 인코더를 쌓아 올려 만든 것이고 디코딩 부분은 인코딩 부분과 동일한 개..
은행과 핀테크 간 새로운 상생 BaaS(Banking as a service) BaaS란? 라이선스를 가진 은행이 핀테크, 스타트업 등 제 3자에게 라이선스 없이 은행 관련 서비스를 할 수 있도록 솔루션 단위의 서비스를 제공하는 것 은행은 이를 통하여 새로운 고객, 서비스와 수익을 창출하고, 제 3자는 라이선스 없이 규제도 피하며 새로운 서비스 창출의 기회를 얻는 것 은행의 디지털 전환은 생존을 위한 필수전략이며, BaaS는 그 최전선에 있음 여전히 은행은 규제산업으로 아무나 라이센스 취득 불가하며 은행은 이러한 강점을 극대화하는 전략으로 BaaS를 적극 활용하면서, 외부의 파트너들과 제휴를 통하여 위기를 극복해야 함 자연어 처리기술 활용법 자연어 처리 기술로 AI가 작성한 블로그 게시물이 바이럴 마케팅..

안녕하세요. 오늘은 토픽모델링에 대해 알아볼게요. 우선 토픽모델링이란? 토픽 모델링(Topic Modeling)은 전체 내용물에서 일정한 패턴을 발견해 내는 알고리즘 기반 텍스트 마이닝(Text Mining)의 한 형태입니다. 위의 사진을 보면 노란색 박스에 분류된 그룹은 유전과 관련된 단어 핑크색 박스에 분류된 그룹은 생명 초록색 박스는 뇌과학, 하늘색 박스는 컴퓨터과학과 관련됐다고 유추할 수 있습니다! 그렇다면 우리는 R로 구현하여 위와 같이 만들어보겠습니다. 그중 LDA(Latent Dirichlet Allocation)를 활용해볼게요! # 패키지 설치 install.packages("topicmodels") install.packages("tidytext") install.packages("tid..