inflearn logo
강의

강의

N
챌린지

챌린지

멘토링

멘토링

N
클립

클립

로드맵

로드맵

지식공유

구현하며 이해하는 이미지 생성모델 - CNN 기초부터 Diffusion까지

DDIM Reverse term 질문

616

godsome_28

작성한 질문수 4

0

DDIM 설명해주신 부분을 보다가 이해가 안 되는 부분이 있어서 질문드립니다.

선생님께서 Reverse term이 이렇다고 말씀을 해주셨는데요.. 다른 강의도 찾고, 논문도 보고 하다가 이 수식이 다음과 같은 과정으로 전개될 수 있다는 것을 확인하였습니다.

그러면 위 그림의 두 번째 수식에서 x_0와 epsilon_t를 (epsilon를 예측하는) Neural Network를 통해 계산한 것으로 바꿔 쓴다면 선생님께서 설명하신 아래의 수식이 되는 것인가요?

다시 말해, DDPM에서 x_0를 x_t와 epsilon_0로 표현할 수 있다고 들었는데, 이 수식을 이용하여 x_0를 예측하는 것인지 질문드립니다.

만약 이게 맞다면, epsilon의 아래첨자에 있는 0, t 이런 것은 그냥 무시하고 생각해도 되는 것인가요?
왜냐하면 초록색 밑줄에 있는 epsilon_t의 아래첨자는 t이지만, x_0를 나타낸 epsilon_0의 아래첨자는 0이어서 그냥 무시하고 생각해도 되는건지 여쭙습니다.

 

python tensorflow cnn Stable Diffusion gan

답변 2

1

인프런 AI 인턴

안녕하세요 godsome_28 님, 인프런 AI 인턴이에요.

DDIM과 관련하여 궁금한 점을 문의해주셔서 감사합니다. DDIM에서 Reverse term에 대한 질문이신 것 같은데요, 이미지를 통해 설명하신 부분을 확인하겠습니다.

DDIM에서는 일반적으로 x_0를 Neural Network를 통해 예측하는 것은 아닙니다. x_0는 초기 데이터 포인트를 의미하고, 이는 주어진 값이기 때문에 예측할 필요가 없습니다.

위에서 언급하신 두 번째 수식에서는 x_t와 epsilon_0로 표현되어 있을 뿐이며, 선생님께서 설명하신 수식과는 일부 다른 표현일 수 있습니다. 하지만 이러한 표현은 개념적으로는 동일하다고 볼 수 있습니다.

epsilon_t와 epsilon_0의 아래첨자는 시점을 나타내는 것입니다. t는 현재 시점을 의미하고, 0은 초기 시점을 의미합니다. 따라서 epsilon_t와 epsilon_0은 시간적인 의미를 가지고 있으며, 이를 무시하고 생각하는 것은 적절하지 않습니다.

감사합니다.

0

멋진

image

제가 생각할 때 e0가 아닌 et가 맞는것 같습니다.

혹시 어떤 출처의 수식일까요?

제가 다시 확인해 보겠습니다.

답변이 너무 늦어서 다시한번 죄송합니다 ㅠㅠ

26,27강 진행 간 노션, html 프롬프트 파일 불일치

0

7

1

<div id="banner">배너 이미지</div> 관련 질문

0

4

1

강의 자료

0

12

1

5강, 오류 수정과 관련해서

0

15

2

27:15 break 출력

0

11

1

컴퓨터를 껐다가 클로드 코드 다시 키는 방법 알려주세요.

0

14

1

kaggle notebook에 service key 설정이 누락된 것 같습니다

1

18

2

수업 노트가 안 보입니다.

0

21

1

Python formatter 설치

0

16

1

55강 파이썬에만있는 연산자들

0

24

2

55강의 파이썬에서만 있는 연산자들

0

21

2

주말에 실행할 경우 update_economic_data_in_background에 로직 변경 필요성

1

29

1

naver 글자 수집 오류 건

0

23

1

쥬피터 노트북이 실행이 안됩니다.

0

25

1

뒤로가기 버튼 같은 것이 있나요?

0

27

1

Replit 강의 자료가 안나와요

0

20

1

강의 연장 문의

0

31

1

프로그램 실행시간에 대한 질문

1

24

2

비중 및 매수 종목수 조정.

1

32

2

Claude api가 소식 동기화가 늦는 문제

1

41

2

[긴급요청2] 28강 동영상 오류(27강 음성 재생) 수정 예정일자를 알려주세요

0

26

1

codex에게 대용량 코드베이스를 인식 시키는 방법은 어떤게 있나요?

0

34

1

출력값 질문

0

31

2

슬롯 관련 문의

1

30

2