질문 & 답변 - 인프런 | 커뮤니티

묻고 답해요

161만명의 커뮤니티!! 함께 토론해봐요.

인프런 TOP Writers

해결됨
[AI 실무] AI Research Engineer를 위한 논문 구현 시작하기 with PyTorch

loss.py 와 train.py 역할 명료화

안녕하세요, 수업 정말 잘 들었습니다 🙂 하나 궁금한 건, loss.py 에서 ContentLoss, StyleLoss 를 정의하고, 이후 해당 클래스들을 train.py 에서 불러온 다음 total_loss 를 계산하였는데. 혹시 loss.py 에서 total_loss 의 클래스도 구현하는게 정석적인 건지 아니면 이처럼 train 과정에서 새로운 loss term 을 하이퍼파라미터와 함께 초기화하여 사용하는게 더 일반적인 건지 궁금합니다.

keymy00njae · 11개월 전 · [AI 실무] AI Research Engineer를 위한 논문 구현 시작하기 with PyTorch

투표점수

0

조회수

139

답변

2
미해결
처음하는 딥러닝과 파이토치(Pytorch) 부트캠프 (쉽게! 기본부터 챗GPT 핵심 트랜스포머까지) [데이터분석/과학 Part3]

[실무에서 판다스 copy()메서드의 깊은복사 얕은복사 조정 소요가 생길까?]

단순히 궁금증이 생긴겁니다.텐서 복사를 보다보니까 판다스 copy()메서드 생각나서 찾아보니판다스에서 COPY()메서드도 깊은복사, 얕은복사(deep 인자가 기본값으로 true)조정이 가능하더라고요(판다스공식문서) 제 질문은 이겁니다. copy()메서드의 deep 인자를 실무에서 조작할 일이 생기나요?

hhs834373 · 11개월 전 · 처음하는 딥러닝과 파이토치(Pytorch) 부트캠프 (쉽게! 기본부터 챗GPT 핵심 트랜스포머까지) [데이터분석/과학 Part3]

투표점수

0

조회수

95

답변

1
미해결
모두를 위한 대규모 언어 모델 LLM(Large Language Model) Part 1 - Llama 2 Fine-Tuning 해보기

데이터셋을 파인튜닝 하는 것과 반대로 필요없는 데이터를 제거하는 방법도 있나요?

지금 fine tuning 단계에서 어떤 데이터셋을 기존의 Llama에 학습을 추가로 시켜서 정보를 더 추가하는 방법 부분을 학습하고 있습니다.혹시 이 반대와 같은 경우가 가능할까요? 예를들어서 Llama모델에서 한국어로 이루어진 모든 데이터를 전부 제거한다. 이런식의 define tuning이 되는 방법이 있는지 궁금합니다.

송정준 · 11개월 전 · 모두를 위한 대규모 언어 모델 LLM(Large Language Model) Part 1 - Llama 2 Fine-Tuning 해보기

투표점수

0

조회수

252

답변

2
미해결
딥러닝 CNN 완벽 가이드 - TFKeras 버전

Augmentation원본에 적용해서 데이터 갯수 자체를 늘리는 행위는 의미가있나요?

지금은 훈련시에 원본 데이터의 형태가 변형되어 train 이미지의 갯수는 변형되지 않는데 애초에 train 이미지에 data augmentation 을적용하여 갯수 자체를 늘려서 학습시키는 건 좋지 않은가요?

Alex · 11개월 전 · 딥러닝 CNN 완벽 가이드 - TFKeras 버전

투표점수

0

조회수

122

답변

2
미해결
딥러닝 CNN 완벽 가이드 - TFKeras 버전

Conv함수 안에 activation 을 넣지 않는 이유가 뭔지 궁금합니다.

model.add(layers.Conv2D(32, (3, 3), activation='relu', input_shape=(28, 28, 1))) 이렇게 쓰기도 했었는데 1. 혹시 activation 을 따로 두게되면 어떤 점이 달라지나요?2. 또한 Conv, BatchNormalization, Activation, MaxPooling2D, Dropuout 이 있다면 순서가 어떻게 되나요?

Alex · 11개월 전 · 딥러닝 CNN 완벽 가이드 - TFKeras 버전

투표점수

0

조회수

158

답변

2
해결됨
[개정판] 딥러닝 컴퓨터 비전 완벽 가이드

MMDetection에서 densehead와 roihead의 차이

안녕하세요. 강의 정말 잘 듣고있습니다!다름이 아니라 MMDetection을 다시 공부하던 중 모델 아키텍쳐 부분에서 densehead와 roihead의 차이가 궁금해져서 이렇게 글을 남깁니다.설명에는 densehead와 roihead 모두 object의 위치와 classification을 수행한다고 나와있어서요.. 감사합니다!

jcy4023 · 11개월 전 · [개정판] 딥러닝 컴퓨터 비전 완벽 가이드

투표점수

1

조회수

108

답변

2
해결됨
딥러닝 이론 + PyTorch 실무 완전 정복

KL Div Loss에서 Negative Entropy를 더해주는 의미에 대해서

안녕하세요.항상 친절하고 자세하게 강의해주셔서 재미있게 배우고 있습니다.다름이 아니라, 본 강의에서 설명해주신 Negative Entropy의 의미에 대해 제가 확실하게 이해한 것이 맞는지 질문하려고 글을 남깁니다. [질문 1] 먼저, 아래에 제가 이해한 내용이 맞을까요?KL Div. Loss에서 negative entropy는 오직 Y_i,c에 대한 항으로만 이루어져 있고 Y_hat과는 전혀 상관이 없으므로 모델의 성능과는 관계 없는 항입니다. 따라서, 학습 데이터셋의 확률 분포 측면에서 생각했을 때, negative entropy가 높을 수록 학습 난이도가 낮은 데이터셋(예: 강아지 vs. 선인장 분류 데이터)이라 생각할 수 있고, 학습 난이도가 쉬우면 쉬울 수록 이 negative entropy 항의 값은 증가합니다. [질문 2] 그렇다면, negative entropy 값이 높을 때(=학습 데이터셋 난이도가 낮을 때) KL Div에서 전체적인 loss 값도 커지게 되는데요. Loss 값이 커지면 결과적으로 모델이 학습할 때 더 큰 폭으로 gradient descent를 수행하게 되어서 좋은 것인가요? KL Div에서 negative entropy를 더해주는 것이 모델 학습과 정확히 어떤 관련이 있는지 잘 이해가 가지 않습니다. 감사합니다!

메타몽열공중 · 2024.12.29 · 딥러닝 이론 + PyTorch 실무 완전 정복

투표점수

1

조회수

146

답변

2
미해결
최신 논문과 유튜브 동영상으로 만드는 2D Pose estimation 실전 프로젝트 따라하기

우분투 설치 후 윈도우 삭제

모델 학습이나 논문 리뷰 등에 질문이 있으시다면 언제든지 남겨주세요!강의 피드백도 환영입니다! 처음으로 AI 입문하여 포즈추정에 관심이 생겨 강의를 수강하게 되었습니다.개발환경을 같이 설정하고 싶은 마음에 영상 보고 우분투를 설치했는데 보통 처음 설치할 때 [디스크 제거 후 우분투 설치]해야 오류가 안 난다고 하셔서 선택하고 설치했습니다. usb 기존 데이터 삭제로 알고 별 생각없이 눌렀는데 사실 기존 윈도우가 삭제라는 걸 뒤늦게 알았는데 복구 방법이 있을까요?제대로 알지 않고 무작정 따라해서 윈도우 데이터 다 날린 제가 답답하네요* 질문에 대한 답변은 일주일 정도 걸릴 수 있습니다.

도도한 강아지 · 2024.12.25 · 최신 논문과 유튜브 동영상으로 만드는 2D Pose estimation 실전 프로젝트 따라하기

투표점수

0

조회수

120

답변

0
미해결
OpenCV 강좌 - 컴퓨터 비전

안녕하세요 맥 cuda 관련해서 질문 올립니다.

안녕하세요 opencv 필요성을 느껴 찾게 되었습니다.제가 맥북프로 사용하고 있는데 cuda 설치가 안 되는데 설치 안해도 괜찮을까요??

& W B · 2024.12.24 · OpenCV 강좌 - 컴퓨터 비전

투표점수

0

조회수

272

답변

1
미해결
딥러닝 CNN 완벽 가이드 - TFKeras 버전

소프트맥스 관련 질문입니다

안녕하세요 선생님얼마전 머신러닝 완벽가이드 강좌에 소프트맥스 질문 드렸던 사람입니다.저는 소프트맥스 연산에 대한 하드웨어 가속기 설계 연구를 진행하고 있는 석사 과정생입니다.그 때 남겨주셨던 답변에 대해 답을 드리면, Softmax의 Input 정밀도라는 것은, 마지막 FC layer를 통과한 후, Softmax층의 input으로 들어가는 값에 몇 bit를 할당할 것이냐에 관한 내용입니다. 즉 제가 알고 싶은 내용을 다시 정리해보면 다음과 같습니다. softmax의 input (혹은 output도)에 많은 bit가 할당되면, H/W resource가 커지게 되므로, 모델의 accuracy를 크게 저해하지 않는 수준에서 어느 정도의 정밀도를 유지해야 하는지 알고 싶습니다. 하여 모델에서 softmax input 전에 따로 텐서 안의 값들을 특정 소수점 자리에서 반올림 해주는 함수를 정의해 반올림을 거치거나, 기존의 FP32를 FP16으로 casting을 거치도록 하여 좀 더 낮은 정밀도에서 잘 돌아가는 지 시뮬레이션을 해보는 중이었습니다. 저의 시뮬레이션 내용은 아래에 첨부하겠습니다. (rounding의 경우는 텐서 안의 값들이 제대로 반올림이 안된 것인지, 아니면 다른 이유가 있는 것인지.. 소수점 10번째에서 rounding을 하든, 20번째, 30번째에서 하든 accuracy에 큰 변화가 없고 거의 36프로 정도를 보였습니다.) 또 일반적으로 H/W설계 시에 floating point보다 fixed point가 구현이 훨씬 간단하며, 리소스 사용량이 매우 적은데, 소프트웨어적으로 모델을 학습시킬 때의 데이터는 대부분 float 32 또는 float 64를 이용하는 것 같습니다. 이는 역전파 과정에서 높은 정밀도가 필요하기 때문이 아닐까 싶은데, 모델 학습 시에 fixed point를 사용했을 때 발생할 수 있는 문제점이 있을까요 ? (소수점 10째자리에서 반올림을 하든, 20,30째자리에서 반올림을 하든 이론상으로는 정밀도가 높아질수록 accuracy가 높아져야 될 것 같은데 제 시뮬레이션 상으로는 모두 36프로의 정확도를 보여 코드에 문제가 있는 것인지, 아니면 알고리즘적으로 문제가 있는 것인지 궁금합니다.) 또한, FP16으로 표현 가능한 최대 정밀도의 값들이 훈련 시에 자주 사용되는지, 실제로 필요한 수준의 정밀도인지 궁금합니다. softmax 층의 input으로 들어가는 logit값(?)들의 range가 어느 정도인지도 궁금합니다. 아마 모델과 사용하는 데이터에 따라 크게 달라질 것 같기는 한데, 제가 읽었던 softmax accelerator관련 논문들에서는 일반적으로 softmax의 input의 range를 [-10,10]으로 가정을 했습니다. (알고리즘 분야가 아닌 하드웨어 논문들이기는 합니다..ㅠㅠ) 허나 실제 학습 시에 floating point를 사용한다는 것은 분명 logit값이 10보다 매우 큰 값이기 때문일 것 같은데 왜 논문들에서는 저런 범위를 가정했는지 궁금하여 든 생각이 혹시 practical한 모델 내에서는 softmax로 들어가기 전에 특정 범위 안으로 들어가도록 전 처리를 해주는 layer가 따로 있는 것인지 궁금했습니다. 또 학습이 점점 진행되면서 logit 값이 학습 후반부로 갈수록 일반적으로 수렴하는 분포(?)가 있는 것인지 궁금합니다.. (epoch별로 logit 값을 출력해보고 싶은데, 아직 코딩에 익숙치 않아 난항을 겪고 있습니다)본질적으로 softmax를 사용하는 이유가 궁금합니다.. multi classification에서 결국 하나의 class로 분류하는 것이 목적인데, 그러면 최종 logit값들 중 가장 큰 값을 선택하면 되는데 왜 굳이 softmax를 통해 확률 분포를 만든 후에 가장 높은 확률의 class로 선택하는지가 궁금합니다. (어차피 softmax를 취한 후의 maximum이나 취하기 전의 maximum이나 같을텐데)( 시뮬레이션 내용 ) 지난 번의 코드는 깃헙에서 임의로 가져온 코드라 조금 더 제대로 된 코드로 실습하고자 이번에는 선생님의 강의 자료인 VGG_Practice 실습 코드를 이용했습니다. 실습 코드의 모델 정의 부분에서 소프트 맥스 layer 직전에 rounding, 혹은 casting하는 부분을 추가한 것 외에 달라진 점은 없습니다.그림 1: float 16그림 2. float 16 결과그림 3. rounding (소수점 10째자리에서 반올림)그림 4. rounding 결과회로 설계 관련 연구를 진행하다 보니 AI 알고리즘에 대한 지식이 부족하여 다소 난해하게 질문드리게 된 점 정말 죄송합니다.. 또 하드웨어적 관점에서 생각하다보니 알고리즘 부분과는 다소 동떨어진 질문이 있을 수도 있을 것 같은데, 그런 부분이 있다면 죄송합니다 ㅠㅠ몇 년전, 동아리 활동을 하면서 머신러닝에 관심을 갖게 되어 선생님의 강의를 수강하고, 잘 공부했었던 기억이 있어 이렇게 다시 찾아 질문 드리게 되었습니다.긴 내용 읽어주셔서 감사드립니다..

90909090001 · 2024.12.23 · 딥러닝 CNN 완벽 가이드 - TFKeras 버전

투표점수

0

조회수

183

답변

1
미해결
모두를 위한 대규모 언어 모델 LLM(Large Language Model) Part 1 - Llama 2 Fine-Tuning 해보기

Lora 기법 질문

Lora 기법으로 인해서 전체 모델의 56%의 파라미터만 fine tuning에 사용됐다고 하는데, 로직 내에서 fine tuning하겠다고 결정하는 기준이 있는건가요?

송정준 · 2024.12.22 · 모두를 위한 대규모 언어 모델 LLM(Large Language Model) Part 1 - Llama 2 Fine-Tuning 해보기

투표점수

0

조회수

141

답변

1
미해결
파이썬을 활용한 머신러닝 딥러닝 입문

MAtplotlib 기초

OOP style 부분에서 자꾸 name 'fig' is not defined라고 오류가 나는데 어떻게 해결하나요..?

한유진 · 2024.12.21 · 파이썬을 활용한 머신러닝 딥러닝 입문

투표점수

0

조회수

96

답변

1
미해결
실전도커: 도커로 나만의 딥러닝 클라우드 컴퓨터 만들기

Microsoft Remote Desktop -> Windows App 으로 변경

Mac App Store에서 Microsoft Remote Desktop이 Windows App으로 이름이 변경됐네요 한참 찾았습니다. 다른 분들 참고하시라고 남겨요!

kt.kim · 2024.12.19 · 실전도커: 도커로 나만의 딥러닝 클라우드 컴퓨터 만들기

투표점수

0

조회수

213

답변

1
미해결
파이썬으로 시작하는 머신러닝+딥러닝(sklearn을 이용한 머신러닝부터 TensorFlow, Keras를 이용한 딥러닝 개발까지)

안내해주신 어떤 곳에도 보스턴 집값 예측 csv파일을 찾을 수 없습니다.

안내해주신 어떤 곳에도 보스턴 집값 예측 csv파일을 찾을 수 없습니다.

Yeoul Son · 2024.12.17 · 파이썬으로 시작하는 머신러닝+딥러닝(sklearn을 이용한 머신러닝부터 TensorFlow, Keras를 이용한 딥러닝 개발까지)

투표점수

0

조회수

96

답변

2
미해결
모두를 위한 대규모 언어 모델 LLM(Large Language Model) Part 1 - Llama 2 Fine-Tuning 해보기

소스코드 다운받을 장소를 알려 주셔요.

강의에 사용된 소스코드는 어디에 있는지 문의드립니다.PDF파일은 있지만, 예제 풀이에 사용되는 colab에서 동작시키는 소스코드를 다운 받을 위치를 가르쳐 주셨으면 합니다.

조의현 · 2024.12.17 · 모두를 위한 대규모 언어 모델 LLM(Large Language Model) Part 1 - Llama 2 Fine-Tuning 해보기

투표점수

0

조회수

124

답변

1
해결됨
딥러닝을 활용한 자연어 처리 (NLP) 과정 (기초부터 ChatGPT/생성 모델까지)

self-attention에서 Wq, Wk, Wv weight matrix 학습과정 질문드립니다.

self-attention에 등장하는 Wq, Wk, Wv weight matrix들에 대한 학습과정 질문입니다. attention score계산 시 query vector에 대해(예를들어 강의에서 설명하신 student vector) key vector들(am, a, student 벡터)의 attention score가 낮게 나온다면, 그게 loss가 되는건가요? 예를들어, Wq, Wk, Wv weight들이 충분히 학습되지 않았을 때를 생각해보면, "I" vector가 Query vector일 때, "student" key vector의 attention score가 가장 높게 나오지 않고 "am" key vector와 attention score가 가장 높게 나올 경우엔 loss가 발생하고 "student" key vector와의 score가 높게 나오도록 Wq, Wk, Wv가 업데이트 된다고 이해하면 될까요?(I와 student는 word embedding에 의해 유사성이 있다고 판단하고)

David · 2024.12.14 · 딥러닝을 활용한 자연어 처리 (NLP) 과정 (기초부터 ChatGPT/생성 모델까지)

투표점수

0

조회수

139

답변

3
미해결
[개정판] 파이썬 머신러닝 완벽 가이드

Softmax 관련 질문입니다.

안녕하세요. 선생님의 강의로 머신러닝 및 딥러닝에 관심을 갖게 되었습니다.다름이 아니고, CIFAR100 dataset에 대해서 VGGNet이라는 모델을 이용해 훈련을 시켜보고 있는데,제가 궁금한 것은 Softmax의 Input의 정밀도를 어디까지 유지하면 모델이 잘 학습될 수 있을까?입니다. 아래의 코드는 training부분입니다. 첫 번째 사진처럼 모델을 훈련시키는데, model(images)를 통해 나온 실제 output을 이용하면 모델이 잘 학습이 되는데 (마지막 epoch의 validation accuracy 55, Top-5 Test Accuracy 80%정도), 이 output을 rounding을 하면 소숫점 아래 20째자리까지 반올림을 해서 높은 정밀도를 유지해도 모델 학습이 아예 되지 않는 (모든 epoch가 끝나도 Validation Accuracy가 1%남짓) 문제가 발생합니다. 이러한 문제가 왜 발생하는지, 어떻게 하면 해결할 수 있을지또 제가 궁금한 Softmax layer에서 요구하는 최소 Input 정밀도에 대해 다른 방법으로 측정할 수 있을지 궁금합니다 ㅠㅠ감사합니다

90909090001 · 2024.12.12 · [개정판] 파이썬 머신러닝 완벽 가이드

투표점수

0

조회수

99

답변

2
해결됨
딥러닝 이론 + PyTorch 실무 완전 정복

GoogleNet Inception 모듈

안녕하세요 선생님강의 잘 보고 있습니다구글넷의 인셉션 모듈 설명 중에 MAX pooling이 포함되어 있는데요보통 max pooling은 인풋의 사이즈를 줄이는 것으로 알고 있는데 그러면 다른 컨볼루션이 통과된 아웃풋과 사이즈가 달라져서 concat이 안되는 거 아닌가요?아니면 여기에 포함된 컨볼루션들은 max pooling과 같은 stride를 같는 걸까요?

HELLO · 2024.12.09 · 딥러닝 이론 + PyTorch 실무 완전 정복

투표점수

1

조회수

125

답변

2
해결됨
딥러닝 CNN 완벽 가이드 - TFKeras 버전

강의 관련 질문입니다

안녕하세요 강사님 강의 잘듣고있습니다 fast api 강의 관련으로 질문드리고 싶어 질문남깁니다 현재 대학교 재학하면서 특정 기능을 수행하는 딥러닝 모델을 만든 후에 이를 배포해 웹에서 사용하는 프로젝트를 수행하려하는 중 강사님께서 fast api와 함께 웹 개발을 전체적으로 다루시는 강의를 출시한 것을 확인했습니다 제가 하려는 프로젝트의 방향과 fast api 강의의 내용이 부합할지 여쭙고 싶어 구매한 다른 강의에 실례를 무릅쓰고 이렇게 질문 드립니다 읽어주셔서 감사합니다

준우 배 · 2024.12.05 · 딥러닝 CNN 완벽 가이드 - TFKeras 버전

투표점수

0

조회수

118

답변

2
미해결
[라즈베리파이] IoT 딥러닝 Computer Vision 실전 프로젝트

강의 자료 다운관련 문의 드립니다.

파이썬 텐서플로우 설치하기 영상을 보고 있는데 RBP_DL01_Raspberry pi install ? Edited (영상에 나와있는 해당문서) 해당 문서는 어디에 있나요? 강의자료 다운받은 곳에는 없는거 같습니다. 제가 받은 자료는 아래와 같습니다. 이거말고 다른곳에서 더 추가로 받아야 하나요?

lyc3001 · 2024.12.03 · [라즈베리파이] IoT 딥러닝 Computer Vision 실전 프로젝트

투표점수

0

조회수

110

답변

1

인기 태그

주간 인기글