embedding이 뭔가요?
569
작성한 질문수 28
sentiment analysis 이론 강의까지 들었는데, embedding 의 기능만 설명하시고 embedding이 뭔지에 대한 설명이 없어서 이해하기 힘들어요. embedding이 뭔지 개념 설명좀 부탁드립니다
답변 1
0
'임베딩(embedding)'은 단어, 문장, 문서, 사용자 등의 고차원 데이터를 저차원의 실수 벡터로 변환하는 것을 말합니다. 임베딩의 가장 대표적인 예는 자연어 처리 분야에서의 단어 임베딩입니다. 예를 들면 다음과 같이 고차원 데이토를 저차원 벡터로 변환합니다.
고양이 = [1, 0, 0...........0,0,0] --> 10000 개의 단어 중 첫번째 단어
개 = [0......0,..............0,, 1, 0] --> 10000 개의 단어 중 9998 번째 단어
말 = [0, .........................0, 1] --> 10000 개의 단어 중 10000 번째 단어
이 고차원 (10000 차원) 벡터를 3 차원 벡터로 임베딩하면,고양이 = [0.1, 0.3, 0.2]
개 = [0.1, 0.3, 0.25]
말 = [-0.2, 0.1, 0.15] 이렇게 됩니다. 강의 중 섹션 1. 자연어 처리 overview 의 "Word Embedding- 개념", "Word Embedding - Word2Vec" 을 참조 하세요.
또한, 임베딩은 추천 시스템에서 사용자와 아이템의 특성을 저차원 벡터로 변환하여, 사용자의 선호를 예측하는데 사용되기도 합니다.
임베딩은 머신러닝 모델이 이해할 수 있는 형태로 복잡한 데이터를 변환하는데 중요한 역할을 합니다. 이를 통해, 복잡한 자연어나 사용자 행동 등의 데이터를 저차원의 벡터로 요약하면서 원래의 데이터에 내재된 중요한 특성들을 보존할 수 있습니다.
더 자세한 내용이 필요하시면 https://simonezz.tistory.com/43 를 참조 하세요.
트랜스포머 FeedForward 관련 질문
0
73
2
파라미터갯수에대한질문(030_IMDB_movie_reviews)
0
62
1
Transformer 번역기 분석 - Part1 따라치기 질문
0
72
2
Encoder-Decoder 질문 드립니다.
0
74
2
model 코드 부분을 따라하다가 전 값이 이상해서요
0
83
1
서적 추천
0
77
1
NLP와 LLM의 차이점
0
559
2
encoder-decoder model 질문입니다.
1
74
1
구글번역기에 대해서 궁금한점이 있습니다.
0
124
2
로드맵에대해서...
0
121
2
Bag of Word (BOW)와TF-IDF시 대명사인 I의행방
0
97
2
강의 교재 최신화 요청
0
145
4
self-attention에서 Wq, Wk, Wv weight matrix 학습과정 질문드립니다.
0
190
3
코랩 환경 설정할 때 질문이 있습니다.
0
248
1
transformer 훈련 마친 모델 공유 가능할까요?
0
217
2
130_Transformer.ipynb transformer.summary() 에러
0
185
2
강사님 궁금한게 있어 문의 드립니다.
0
129
1
강사님 Tensorflow 실습코드 중 궁금한 점이 있습니다.
0
126
1
패딩과 관련한 질문 드립니다.
0
172
1
Encoder Decoder 부터 Simple Chatbot까지 이상답변
0
219
1
seq2seq 모델
0
328
1
강의 내용중 질문있습니다.
0
199
1
Transformer 번역기 부분에 대해 질문 있습니다.
0
214
1
320_Custom_Sentiment_Analysis_navermovie.ipynb 실행 시 오류 납니다.
0
317
2





