context_size 질문드립니다.
236
23 câu hỏi đã được viết
1.for _ in range(4):
if random.random() < 0.5 or i >= len(text) - 3:
rand_id = random.randint(0, i-1)
else:
rand_id = random.randint(i+3, len(text)-1)
data.append((text[i], text[rand_id], 0))
1. range(4)를준 이유가 궁굼합니다.
2. 상위 코드 0.5 or i >=len(text) -3 조건을 이렇게 설정한 이유가 궁굼합니다.
3. 괜찮으시다면 혹시 상위 코드조금 자세하게 설명해주실수 있나요 ?
Câu trả lời 1
0
안녕하세요, Justin입니다.
1. context_size가 2이기 때문입니다.
skipgram 시 중심 단어로부터 2칸 내 단어들과 비교하기 위해 range(4)로 설정하였습니다.
2. skipgram 시 주변 단어 중 일부를 무작위로 추출하여 데이터를 구성하기 때문에,
이를 구현하기 위해서 해당 코드로 설정하였습니다. 이외 다른 방법으로도 무작위 추출 성격만 띈다면 코드는 변경 가능합니다.
3. random.random을 통해 0~1 사이 실수를 추출하여 이가 0.5 미만이거나
전체 단어 길이 - 3 값이 현재 i 값보다 큰 경우 rand_id 즉 주변 단어 중 일부를 지칭하는 인덱스 값을 0과 i-1 값중 1개의 정수로 표현하여 인덱스를 지정하고, 다른 경우는 i+3과 전체 단어 길이에서 1값을 뺀 값 사이의 정수로 표현하여 인덱스를 지정합니다. word2vec skipgram 방식의 원리를 이해하시면 코드 이해에 도움이 될 것 같습니다.
추천영상 : https://www.youtube.com/watch?v=sY4YyacSsLc
감사합니다.
import torch가 안되는 경우는 어떻게 하나요?
0
16
1
소리가 겹쳐서 들려요
0
23
2
20강에서 파인튜닝 때 사용한 데이터가 없어졌습니다. LoRA Trainer 매개변수도 라이브러리 업그레이드로 수정되었습니다.
0
20
1
[개정판] 딥러닝 컴퓨터 비전 완벽 가이드 먼저? 구현하며 배우는 Transformer 먼저?
0
30
1
전 강의와 전혀 이어지지가 않음
0
30
1
pytorch local 설치 옵션에 conda 가 없습니다.
0
38
3
pc에서는 괜찮은데 탭으로 들으니 화면확대시 화면이 까맙니다
0
22
1
모든 자료 다운로드 누를때마다 똑같은 excel파일이 다운로드 받아짐. 노션 주소 공유되나요?
0
32
2
강화학습저장 및 로드
0
57
1
paperswithcode 서비스 종료 관련 문의
0
209
2
batch size 질문이 있습니다!
0
468
1
torchtext.data 에러
0
2026
1
파이썬 코드 다운로드 받을 수 있는 곳이 있을까요?
0
546
1
train과 test 관련해서 질문드립니다!
0
262
1
혹시 audio관련해서 stt나 tts등 pytorch 관련해서 강의 하실 수 있나요?
0
368
1
teacher_force = random.random() < teacher_forcing_ratio
0
323
1
질문드립니다.
0
266
1
파이썬 for 문 질문드립니다.
0
257
1
Encoder와 Decoder Embedding에서 같은 벡터공간에 임베딩되는건가요?
0
272
1
word2vec
0
383
1
RNN과 CNN을 섞는법
0
295
2
13:30쪽 사운드가 너무 깨집니다ㅠㅠ
3
229
1
NLP에 RNN을 사용하는 이유
0
270
1
실습데이터 문의 - [실습]자연어 처리에 필요한 기본 배경 지식 실습
0
228
1

