inflearn logo
강의

Khóa học

Chia sẻ kiến thức

[PyTorch] Học NLP dễ dàng và nhanh chóng

[Thực hành] Thực hành Word2Vec và sử dụng vectơ GloVe

context_size 질문드립니다.

236

chjeong627

23 câu hỏi đã được viết

0

 

 

1.for _ in range(4):

            if random.random() < 0.5 or i >= len(text) - 3:

                rand_id = random.randint(0, i-1)

            else:

                rand_id = random.randint(i+3, len(text)-1)

            data.append((text[i], text[rand_id], 0))

 

1.  range(4)를준 이유가 궁굼합니다.

2.  상위 코드 0.5 or  i >=len(text) -3 조건을 이렇게 설정한  이유가 궁굼합니다. 

 

3. 괜찮으시다면 혹시 상위 코드조금 자세하게 설명해주실수 있나요 ?

딥러닝 NLP pytorch 인공신경망

Câu trả lời 1

0

Justin

안녕하세요, Justin입니다.

 

1. context_size가 2이기 때문입니다.
skipgram 시 중심 단어로부터 2칸 내 단어들과 비교하기 위해 range(4)로 설정하였습니다.

2. skipgram 시 주변 단어 중 일부를 무작위로 추출하여 데이터를 구성하기 때문에,
이를 구현하기 위해서 해당 코드로 설정하였습니다. 이외 다른 방법으로도 무작위 추출 성격만 띈다면 코드는 변경 가능합니다. 

3. random.random을 통해 0~1 사이 실수를 추출하여 이가 0.5 미만이거나
전체 단어 길이 - 3 값이 현재 i 값보다 큰 경우 rand_id 즉 주변 단어 중 일부를 지칭하는 인덱스 값을 0과 i-1 값중 1개의 정수로 표현하여 인덱스를 지정하고, 다른 경우는 i+3과 전체 단어 길이에서 1값을 뺀 값 사이의 정수로 표현하여 인덱스를 지정합니다. word2vec skipgram 방식의 원리를 이해하시면 코드 이해에 도움이 될 것 같습니다.

추천영상 : https://www.youtube.com/watch?v=sY4YyacSsLc

감사합니다.

import torch가 안되는 경우는 어떻게 하나요?

0

16

1

소리가 겹쳐서 들려요

0

23

2

20강에서 파인튜닝 때 사용한 데이터가 없어졌습니다. LoRA Trainer 매개변수도 라이브러리 업그레이드로 수정되었습니다.

0

20

1

[개정판] 딥러닝 컴퓨터 비전 완벽 가이드 먼저? 구현하며 배우는 Transformer 먼저?

0

30

1

전 강의와 전혀 이어지지가 않음

0

30

1

pytorch local 설치 옵션에 conda 가 없습니다.

0

38

3

pc에서는 괜찮은데 탭으로 들으니 화면확대시 화면이 까맙니다

0

22

1

모든 자료 다운로드 누를때마다 똑같은 excel파일이 다운로드 받아짐. 노션 주소 공유되나요?

0

32

2

강화학습저장 및 로드

0

57

1

paperswithcode 서비스 종료 관련 문의

0

209

2

batch size 질문이 있습니다!

0

468

1

torchtext.data 에러

0

2026

1

파이썬 코드 다운로드 받을 수 있는 곳이 있을까요?

0

546

1

train과 test 관련해서 질문드립니다!

0

262

1

혹시 audio관련해서 stt나 tts등 pytorch 관련해서 강의 하실 수 있나요?

0

368

1

teacher_force = random.random() < teacher_forcing_ratio

0

323

1

질문드립니다.

0

266

1

파이썬 for 문 질문드립니다.

0

257

1

Encoder와 Decoder Embedding에서 같은 벡터공간에 임베딩되는건가요?

0

272

1

word2vec

0

383

1

RNN과 CNN을 섞는법

0

295

2

13:30쪽 사운드가 너무 깨집니다ㅠㅠ

3

229

1

NLP에 RNN을 사용하는 이유

0

270

1

실습데이터 문의 - [실습]자연어 처리에 필요한 기본 배경 지식 실습

0

228

1