Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | |||||
3 | 4 | 5 | 6 | 7 | 8 | 9 |
10 | 11 | 12 | 13 | 14 | 15 | 16 |
17 | 18 | 19 | 20 | 21 | 22 | 23 |
24 | 25 | 26 | 27 | 28 | 29 | 30 |
Tags
- tableau
- 데이터 전처리
- 데이터분석
- 코딩테스트
- pytorch
- 통계
- 데이터 분석
- 이것이 코딩테스트다
- Python
- scikit learn
- SQLD
- 데이터분석준전문가
- Deep Learning Specialization
- Google ML Bootcamp
- SQL
- 태블로
- IRIS
- 파이썬
- pandas
- 시각화
- 회귀분석
- 자격증
- ADsP
- matplotlib
- sklearn
- 이코테
- 딥러닝
- ML
- r
- 머신러닝
Archives
- Today
- Total
목록linear layer (1)
함께하는 데이터 분석
[NLP] Transformer②
Positional Encoding 앞서 포스팅한 Transformer① 모델에서 한 가지 부족한 부분은 입력 문장에서 단어들의 순서를 고려하지 않았다는 것 이것을 추가하기 위해 Transformer 모델은 각각의 입력 임베딩에 "positional encoding"이라고 불리는 하나의 벡터를 추가 이 벡터들은 모델이 학습하는 특정한 패턴을 따르는데, 이 패턴은 모델이 각 단어의 위치와 시퀀스 내의 다른 단어 간의 위치 차이에 대한 정보를 알 수 있게 해 줌 이 벡터들을 추가하기로 한 배경에는 이 값들을 단어들의 임베딩에 추가하는 것이 query/key/value 벡터들로 나중에 투영되었을 때 단어들 간의 거리를 늘릴 수 있다는 점 모델에게 단어의 순서에 대한 정보를 주기 위해, 위치 별로 특정한 패턴을..
데이터분석 공부/NLP
2023. 2. 5. 15:46