미해결
구현하며 이해하는 이미지 생성모델 - CNN 기초부터 Diffusion까지DDIM Reverse term 질문
DDIM 설명해주신 부분을 보다가 이해가 안 되는 부분이 있어서 질문드립니다.선생님께서 Reverse term이 이렇다고 말씀을 해주셨는데요.. 다른 강의도 찾고, 논문도 보고 하다가 이 수식이 다음과 같은 과정으로 전개될 수 있다는 것을 확인하였습니다.그러면 위 그림의 두 번째 수식에서 x_0와 epsilon_t를 (epsilon를 예측하는) Neural Network를 통해 계산한 것으로 바꿔 쓴다면 선생님께서 설명하신 아래의 수식이 되는 것인가요? 다시 말해, DDPM에서 x_0를 x_t와 epsilon_0로 표현할 수 있다고 들었는데, 이 수식을 이용하여 x_0를 예측하는 것인지 질문드립니다.만약 이게 맞다면, epsilon의 아래첨자에 있는 0, t 이런 것은 그냥 무시하고 생각해도 되는 것인가요?왜냐하면 초록색 밑줄에 있는 epsilon_t의 아래첨자는 t이지만, x_0를 나타낸 epsilon_0의 아래첨자는 0이어서 그냥 무시하고 생각해도 되는건지 여쭙습니다.