강의

멘토링

커뮤니티

Cộng đồng Hỏi & Đáp của Inflearn

Hình ảnh hồ sơ của godsome283663
godsome283663

câu hỏi đã được viết

Mô hình tạo hình ảnh cần triển khai và hiểu - Từ kiến ​​thức cơ bản về CNN đến Khuếch tán

DDIM Reverse term 질문

Viết

·

582

0

DDIM 설명해주신 부분을 보다가 이해가 안 되는 부분이 있어서 질문드립니다.

선생님께서 Reverse term이 이렇다고 말씀을 해주셨는데요.. 다른 강의도 찾고, 논문도 보고 하다가 이 수식이 다음과 같은 과정으로 전개될 수 있다는 것을 확인하였습니다.

그러면 위 그림의 두 번째 수식에서 x_0와 epsilon_t를 (epsilon를 예측하는) Neural Network를 통해 계산한 것으로 바꿔 쓴다면 선생님께서 설명하신 아래의 수식이 되는 것인가요?

다시 말해, DDPM에서 x_0를 x_t와 epsilon_0로 표현할 수 있다고 들었는데, 이 수식을 이용하여 x_0를 예측하는 것인지 질문드립니다.

만약 이게 맞다면, epsilon의 아래첨자에 있는 0, t 이런 것은 그냥 무시하고 생각해도 되는 것인가요?
왜냐하면 초록색 밑줄에 있는 epsilon_t의 아래첨자는 t이지만, x_0를 나타낸 epsilon_0의 아래첨자는 0이어서 그냥 무시하고 생각해도 되는건지 여쭙습니다.

 

pythontensorflowcnnStable Diffusiongan

Câu trả lời 2

1

안녕하세요 godsome_28 님, 인프런 AI 인턴이에요.

DDIM과 관련하여 궁금한 점을 문의해주셔서 감사합니다. DDIM에서 Reverse term에 대한 질문이신 것 같은데요, 이미지를 통해 설명하신 부분을 확인하겠습니다.

DDIM에서는 일반적으로 x_0를 Neural Network를 통해 예측하는 것은 아닙니다. x_0는 초기 데이터 포인트를 의미하고, 이는 주어진 값이기 때문에 예측할 필요가 없습니다.

위에서 언급하신 두 번째 수식에서는 x_t와 epsilon_0로 표현되어 있을 뿐이며, 선생님께서 설명하신 수식과는 일부 다른 표현일 수 있습니다. 하지만 이러한 표현은 개념적으로는 동일하다고 볼 수 있습니다.

epsilon_t와 epsilon_0의 아래첨자는 시점을 나타내는 것입니다. t는 현재 시점을 의미하고, 0은 초기 시점을 의미합니다. 따라서 epsilon_t와 epsilon_0은 시간적인 의미를 가지고 있으며, 이를 무시하고 생각하는 것은 적절하지 않습니다.

감사합니다.

0

hjk1000님의 프로필 이미지
hjk1000
Người chia sẻ kiến thức

image

제가 생각할 때 e0가 아닌 et가 맞는것 같습니다.

혹시 어떤 출처의 수식일까요?

제가 다시 확인해 보겠습니다.

답변이 너무 늦어서 다시한번 죄송합니다 ㅠㅠ

Hình ảnh hồ sơ của godsome283663
godsome283663

câu hỏi đã được viết

Đặt câu hỏi