질문 & 답변 - 인프런 | 커뮤니티

묻고 답해요

169만명의 커뮤니티!! 함께 토론해봐요.

인프런 TOP Writers

해결됨
[개정판] 딥러닝 컴퓨터 비전 완벽 가이드

RCNN 학습 개요에 대해 질문있습니다.

제가 이해한 바로는원본 이미지(ex. pascalVoc)와 Annotation 파일을 이용해 selective search를 진행해 후보 바운딩 박스 2000개 추출. 이때 G.T는 Annotation 파일에 담겨있던 정답 바운딩 박스 정보로, 바운딩 박스 좌표와 정답 object label이 담겨있고, SS predicted는 selective search로 뽑은 후보 바운딩 박스로, 바운딩 박스 좌표만 존재.이렇게 얻은 2000개의 후보 바운딩 박스를 딥러닝 네트워크에 주입하기전, ImageNet 데이터로 Feature Extractor Pre-train.질문1) 이 Pre-train의 목적이 무엇인가요? AlexNet이 입력으로 이미지를 받으면 출력으로 그 이미지의 클래스를 예측하도록 훈련하는 것인가요? G.T와 SS 영역 IOU가 0.5 이상인 경우만 해당 클래스로, 나머지는 Background로 fine-tuning질문2) 이때 fine-tuning이라는 것은 iou 점수에 따라 SS 즉, 후보 바운딩 박스에 이 바운딩 박스와 IOU가 높은 G.T에 담긴 label을 부여하는 작업. 즉, 데이터 전처리 같은 작업인 것인가요? 아니면 pre-train 된 AlexNet에 2000개의 후보 바운딩 박스와 G.T를 입력해 어떠한 학습이 진행되는 것인가요.위의 과정으로 얻은 Feature Map을 1차원으로 만들고, 그 값을 SVM에 넣어 예측값을 만드는데, 그 전에 SVM을 G.T로만 학습한다.질문3) 여기서 G.T로만 학습한되 0.3 IOU 이하인 SS는 background로 설정, 0.3 이상이지만 G.T와 label이 다른 SS는 무시하고 학습한다는데, 저는 이 말이 SS 중에서 IOU 점수와 label에 따라 background와 무시할 것을 정하고 그 이외에 것으로 SVM을 학습한다고 이해되는데, 이 말이 첫번째 줄의 G.T로만 학습한다는 말과 맞지 않은것 같아 이해가 힘듭니다.

배진영 · 2025.02.01 · [개정판] 딥러닝 컴퓨터 비전 완벽 가이드

투표점수

0

조회수

116

답변

2
미해결
딥러닝 CNN 완벽 가이드 - TFKeras 버전

배치 정규화의 이해와 적용 2 강의 질문

선생님 안녕하세요좋은 강의 감사드립니다. 배치 정규화의 이해와 적용 02 강의의 12:19 ~ 12:20 를 보시면 코드에 이상한(?) 부분이 있는 것 같습니다. x = Conv2D(filters=64, kernel_size=3, padding='same')(x) x = Activation('relu')(x) x = Activation('relu')(x) x = MaxPooling2D(pool_size=2)(x)코드가 이렇게 되어있는데요. 왜 activation을 2번 해주시는 것이죠? 아래와 같이 수정되어야 하는 것이 아닌지, 질문드립니다.x = Conv2D(filters=64, kernel_size=3, padding='same')(x) x = BatchNormalization()(x) ########### 수 x = Activation('relu')(x) x = MaxPooling2D(pool_size=2)(x)

nathan · 2025.01.28 · 딥러닝 CNN 완벽 가이드 - TFKeras 버전

투표점수

0

조회수

145

답변

2
미해결
[개정판] 딥러닝 컴퓨터 비전 완벽 가이드

모델학습에서 문제가발생합니다. 도와주세요

에포크 5에서 오류가 발생합니다. AttributeError Traceback (most recent call last) <ipython-input-19-00485008cd01> in <cell line: 0>() 13 #config.save_freq = eval;config.map_freq = 5 14 # 1 epoch시마다 P100에서 약 3분30초 걸림. 적절한 epochs 수 설정 필요. ---> 15 model.fit( 16 get_dataset(True, config), 17 epochs=15, 5 frames/usr/local/lib/python3.11/dist-packages/numpy/__init__.py in __getattr__(attr) 322 def _sanity_check(): 323 """ --> 324 Quick sanity checks for common bugs caused by environment. 325 There are some cases e.g. with wrong BLAS ABI that cause wrong 326 results under specific runtime conditions that are not necessarily AttributeError: module 'numpy' has no attribute 'float'. `np.float` was a deprecated alias for the builtin `float`. To avoid this error in existing code, use `float` by itself. Doing this will not modify any behavior and is safe. If you specifically wanted the numpy scalar type, use `np.float64` here. The aliases was originally deprecated in NumPy 1.20; for more details and guidance see the original release note at: https://numpy.org/devdocs/release/1.20.0-notes.html#deprecations

최용석 · 2025.01.25 · [개정판] 딥러닝 컴퓨터 비전 완벽 가이드

투표점수

0

조회수

139

답변

2
미해결
[개정판] 딥러닝 컴퓨터 비전 완벽 가이드

mmdetection 문제발생합니다.

# 아래를 수행하기 전에 kernel을 restart 해야 함. from mmdet.apis import init_detector, inference_detector import mmcv /usr/local/lib/python3.11/dist-packages/mmcv/__init__.py:20: UserWarning: On January 1, 2023, MMCV will release v2.0.0, in which it will remove components related to the training process and add a data transformation module. In addition, it will rename the package names mmcv to mmcv-lite and mmcv-full to mmcv. See https://github.com/open-mmlab/mmcv/blob/master/docs/en/compatibility.md for more details. warnings.warn( --------------------------------------------------------------------------- ImportError Traceback (most recent call last) <ipython-input-1-635200d92710> in <cell line: 0>() 1 # 아래를 수행하기 전에 kernel을 restart 해야 함. ----> 2 from mmdet.apis import init_detector, inference_detector 3 import mmcv 5 frames /usr/lib/python3.11/importlib/__init__.py in import_module(name, package) 124 break 125 level += 1 --> 126 return _bootstrap._gcd_import(name[level:], package, level) 127 128 ImportError: libcudart.so.11.0: cannot open shared object file: No such file or directory --------------------------------------------------------------------------- NOTE: If your import is failing due to a missing package, you can manually install dependencies using either !pip or !apt. To view examples of installing some common dependencies, click the "Open Examples" button below. --------------------------------------------------------------------------- mmdetection 임포트 문제발생합니다.

최용석 · 2025.01.20 · [개정판] 딥러닝 컴퓨터 비전 완벽 가이드

투표점수

0

조회수

197

답변

3
미해결
[개정판] 딥러닝 컴퓨터 비전 완벽 가이드

mmdetection 다운에 문제가 있는 것 같습니다.

안녕하세요 강의 정말 잘 듣고있습니다!다름이 아니라 기존에는 잘 작동되었던 mmdetection 다운이 갑자기 안되서 말씀드립니다.열심히 구글링해봤는데 안나와서 여기에 올려봅니다.torch와 torchvision 설치시에 error가 발생합니다.여기서 발생하는 error는 pip depency에러가 아닙니다.최종적으로 mmdet.apis 호출에 error가 발생합니다.에러 내용은 import error로 "ImportError: libcudart.so.11.0: cannot open shared object file: No such file or directory" 이렇게 나타납니다.

jcy4023 · 2025.01.18 · [개정판] 딥러닝 컴퓨터 비전 완벽 가이드

투표점수

1

조회수

169

답변

3
미해결
[개정판] 딥러닝 컴퓨터 비전 완벽 가이드

이제는 이 사이트가 안되는것 같습니다...

이상한 사이트로 접속이 되네요

Alex · 2025.01.16 · [개정판] 딥러닝 컴퓨터 비전 완벽 가이드

투표점수

-1

조회수

142

답변

1
미해결
[개정판] 딥러닝 컴퓨터 비전 완벽 가이드

dataset.yaml 은 애노테이션인가요?

dataset.yaml 은 애노테이션인가요?

Alex · 2025.01.16 · [개정판] 딥러닝 컴퓨터 비전 완벽 가이드

투표점수

0

조회수

93

답변

2
미해결
[개정판] 딥러닝 컴퓨터 비전 완벽 가이드

정확도 문제

video 에서는 inference 점수가 0.35와 같은것도 추론이 되는데 실제로 이러한 낮은 추론 점수가 실제로도 쓰이거나 의미가 있다고 볼 수 있나요?

Alex · 2025.01.16 · [개정판] 딥러닝 컴퓨터 비전 완벽 가이드

투표점수

0

조회수

102

답변

2
해결됨
[개정판] 딥러닝 컴퓨터 비전 완벽 가이드

어디다가 작성해야할 지 몰라 여기에 작성합니다..

- 학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요! - 먼저 유사한 질문이 있었는지 검색해보세요. - 강의 내용을 질문할 경우 몇분 몇초의 내용에 대한 것인지 반드시 기재 부탁드립니다. - 서로 예의를 지키며 존중하는 문화를 만들어가요. - 잠깐! 인프런 서비스 운영 관련 문의는 1:1 문의하기를 이용해주세요. 안녕하세요 교수님. 강의 정말 잘 듣고있습니다.교수님의 fast api를 듣고싶은 수강생인데 환경때문에 어디다가 질문해야할지 고민하다가 여기다가라도 써봅니다.(죄송합니다.)저는 인공지능을 활용해 제가 원하는 앱, 웹을 만들고 싶은 꿈을 가지고 교수님 강의를 들으며 공부하고 있습니다.그러던 중 여기까지 오게 되었고(머신러닝 완벽 가이드 -> cnn -> object detection) 다음 강의로 fast api 강의를 듣고자 합니다. 여기서 질문을 드리겠습니다. 제가 현재 군인으로 사지방에서 공부를 진행하는데 github의 codespace 환경만으로도 수행하는데 문제는 없을까요?sql, html에 대해서는 아직 공부를 안해봤는데 어느정도의 지식을 알아야 할까요?

jcy4023 · 2025.01.14 · [개정판] 딥러닝 컴퓨터 비전 완벽 가이드

투표점수

1

조회수

117

답변

1
미해결
[개정판] 딥러닝 컴퓨터 비전 완벽 가이드

PCO는 어떻게 결정되나요?

그 이미지일 확률은 어떻게 계산되는건가요? PCO * IOU 가 Ci가 되는데 어떻게 결정되는건가요?

Alex · 2025.01.10 · [개정판] 딥러닝 컴퓨터 비전 완벽 가이드

투표점수

0

조회수

92

답변

2
미해결
[개정판] 딥러닝 컴퓨터 비전 완벽 가이드

에러 문의

이러한 에러가 발생하는데 왜 일어나는건가요?

Alex · 2025.01.09 · [개정판] 딥러닝 컴퓨터 비전 완벽 가이드

투표점수

0

조회수

85

답변

1
미해결
[개정판] 딥러닝 컴퓨터 비전 완벽 가이드

에러 발생 질문

여러번 다시 했는데 아래와 같은 에러가 발생하네요kernel 을 다시하니까 되는데 왜 그런건가요? 무엇때문에 생기는지가 궁금합니다.

Alex · 2025.01.08 · [개정판] 딥러닝 컴퓨터 비전 완벽 가이드

투표점수

0

조회수

93

답변

2
미해결
[개정판] 딥러닝 컴퓨터 비전 완벽 가이드

fast RCNN vs faster RCNN

fast RCNN의 경우에는 selective search 기반이고faster RCNN의 기준에는 RPN(anchor box)를 사용하게 되는데 두개의 연산차가 이러한 속도와 정확도 차이에 큰 영향을 미치는건가요?

Alex · 2025.01.08 · [개정판] 딥러닝 컴퓨터 비전 완벽 가이드

투표점수

0

조회수

101

답변

2
미해결
[개정판] 딥러닝 컴퓨터 비전 완벽 가이드

RPN 질문

안녕하세요 선생님. 질문이있습니다. 1. 결국에는 Anchorbox 중에서 가장 확률이 높은 anchorbox의 x, y 좌표를 loss 기반으로 학습시키는걸로 이해를 했는데 맞나요?2. 그러면 그렇게 수정된 anchorbox는 변한채로 남아서 다음학습 때 수정된 anchorbox 좌표가 또 학습되고 이런식인가요?

Alex · 2025.01.08 · [개정판] 딥러닝 컴퓨터 비전 완벽 가이드

투표점수

0

조회수

68

답변

2
미해결
[개정판] 딥러닝 컴퓨터 비전 완벽 가이드

Bounding Box Regression 학습 질문

FeatureMap 단에서는 이 이미지에 대한 정보를 가지고 있지 않은데 어떻게 Bounding Box Regression 이 학습되는지 모르겠습니다. CNN 처럼 Loss 를 기반으로 Back Propagation 과 같이 자동으로 weight가 업데이트 되려면 기준이 있어야 하는데 여기서 FC layer를 거쳐서 레이블이 할당되지 않았음에도 불구하고 어떻게 해당 좌표들이 구해지고 업데이트 되는지 모르겠습니다.

Alex · 2025.01.07 · [개정판] 딥러닝 컴퓨터 비전 완벽 가이드

투표점수

0

조회수

86

답변

2
미해결
딥러닝 CNN 완벽 가이드 - TFKeras 버전

Augmentation원본에 적용해서 데이터 갯수 자체를 늘리는 행위는 의미가있나요?

지금은 훈련시에 원본 데이터의 형태가 변형되어 train 이미지의 갯수는 변형되지 않는데 애초에 train 이미지에 data augmentation 을적용하여 갯수 자체를 늘려서 학습시키는 건 좋지 않은가요?

Alex · 2025.01.02 · 딥러닝 CNN 완벽 가이드 - TFKeras 버전

투표점수

0

조회수

152

답변

2
미해결
딥러닝 CNN 완벽 가이드 - TFKeras 버전

Conv함수 안에 activation 을 넣지 않는 이유가 뭔지 궁금합니다.

model.add(layers.Conv2D(32, (3, 3), activation='relu', input_shape=(28, 28, 1))) 이렇게 쓰기도 했었는데 1. 혹시 activation 을 따로 두게되면 어떤 점이 달라지나요?2. 또한 Conv, BatchNormalization, Activation, MaxPooling2D, Dropuout 이 있다면 순서가 어떻게 되나요?

Alex · 2025.01.02 · 딥러닝 CNN 완벽 가이드 - TFKeras 버전

투표점수

0

조회수

213

답변

2
해결됨
[개정판] 딥러닝 컴퓨터 비전 완벽 가이드

MMDetection에서 densehead와 roihead의 차이

안녕하세요. 강의 정말 잘 듣고있습니다!다름이 아니라 MMDetection을 다시 공부하던 중 모델 아키텍쳐 부분에서 densehead와 roihead의 차이가 궁금해져서 이렇게 글을 남깁니다.설명에는 densehead와 roihead 모두 object의 위치와 classification을 수행한다고 나와있어서요.. 감사합니다!

jcy4023 · 2025.01.01 · [개정판] 딥러닝 컴퓨터 비전 완벽 가이드

투표점수

1

조회수

140

답변

2
미해결
딥러닝 CNN 완벽 가이드 - TFKeras 버전

소프트맥스 관련 질문입니다

안녕하세요 선생님얼마전 머신러닝 완벽가이드 강좌에 소프트맥스 질문 드렸던 사람입니다.저는 소프트맥스 연산에 대한 하드웨어 가속기 설계 연구를 진행하고 있는 석사 과정생입니다.그 때 남겨주셨던 답변에 대해 답을 드리면, Softmax의 Input 정밀도라는 것은, 마지막 FC layer를 통과한 후, Softmax층의 input으로 들어가는 값에 몇 bit를 할당할 것이냐에 관한 내용입니다. 즉 제가 알고 싶은 내용을 다시 정리해보면 다음과 같습니다. softmax의 input (혹은 output도)에 많은 bit가 할당되면, H/W resource가 커지게 되므로, 모델의 accuracy를 크게 저해하지 않는 수준에서 어느 정도의 정밀도를 유지해야 하는지 알고 싶습니다. 하여 모델에서 softmax input 전에 따로 텐서 안의 값들을 특정 소수점 자리에서 반올림 해주는 함수를 정의해 반올림을 거치거나, 기존의 FP32를 FP16으로 casting을 거치도록 하여 좀 더 낮은 정밀도에서 잘 돌아가는 지 시뮬레이션을 해보는 중이었습니다. 저의 시뮬레이션 내용은 아래에 첨부하겠습니다. (rounding의 경우는 텐서 안의 값들이 제대로 반올림이 안된 것인지, 아니면 다른 이유가 있는 것인지.. 소수점 10번째에서 rounding을 하든, 20번째, 30번째에서 하든 accuracy에 큰 변화가 없고 거의 36프로 정도를 보였습니다.) 또 일반적으로 H/W설계 시에 floating point보다 fixed point가 구현이 훨씬 간단하며, 리소스 사용량이 매우 적은데, 소프트웨어적으로 모델을 학습시킬 때의 데이터는 대부분 float 32 또는 float 64를 이용하는 것 같습니다. 이는 역전파 과정에서 높은 정밀도가 필요하기 때문이 아닐까 싶은데, 모델 학습 시에 fixed point를 사용했을 때 발생할 수 있는 문제점이 있을까요 ? (소수점 10째자리에서 반올림을 하든, 20,30째자리에서 반올림을 하든 이론상으로는 정밀도가 높아질수록 accuracy가 높아져야 될 것 같은데 제 시뮬레이션 상으로는 모두 36프로의 정확도를 보여 코드에 문제가 있는 것인지, 아니면 알고리즘적으로 문제가 있는 것인지 궁금합니다.) 또한, FP16으로 표현 가능한 최대 정밀도의 값들이 훈련 시에 자주 사용되는지, 실제로 필요한 수준의 정밀도인지 궁금합니다. softmax 층의 input으로 들어가는 logit값(?)들의 range가 어느 정도인지도 궁금합니다. 아마 모델과 사용하는 데이터에 따라 크게 달라질 것 같기는 한데, 제가 읽었던 softmax accelerator관련 논문들에서는 일반적으로 softmax의 input의 range를 [-10,10]으로 가정을 했습니다. (알고리즘 분야가 아닌 하드웨어 논문들이기는 합니다..ㅠㅠ) 허나 실제 학습 시에 floating point를 사용한다는 것은 분명 logit값이 10보다 매우 큰 값이기 때문일 것 같은데 왜 논문들에서는 저런 범위를 가정했는지 궁금하여 든 생각이 혹시 practical한 모델 내에서는 softmax로 들어가기 전에 특정 범위 안으로 들어가도록 전 처리를 해주는 layer가 따로 있는 것인지 궁금했습니다. 또 학습이 점점 진행되면서 logit 값이 학습 후반부로 갈수록 일반적으로 수렴하는 분포(?)가 있는 것인지 궁금합니다.. (epoch별로 logit 값을 출력해보고 싶은데, 아직 코딩에 익숙치 않아 난항을 겪고 있습니다)본질적으로 softmax를 사용하는 이유가 궁금합니다.. multi classification에서 결국 하나의 class로 분류하는 것이 목적인데, 그러면 최종 logit값들 중 가장 큰 값을 선택하면 되는데 왜 굳이 softmax를 통해 확률 분포를 만든 후에 가장 높은 확률의 class로 선택하는지가 궁금합니다. (어차피 softmax를 취한 후의 maximum이나 취하기 전의 maximum이나 같을텐데)( 시뮬레이션 내용 ) 지난 번의 코드는 깃헙에서 임의로 가져온 코드라 조금 더 제대로 된 코드로 실습하고자 이번에는 선생님의 강의 자료인 VGG_Practice 실습 코드를 이용했습니다. 실습 코드의 모델 정의 부분에서 소프트 맥스 layer 직전에 rounding, 혹은 casting하는 부분을 추가한 것 외에 달라진 점은 없습니다.그림 1: float 16그림 2. float 16 결과그림 3. rounding (소수점 10째자리에서 반올림)그림 4. rounding 결과회로 설계 관련 연구를 진행하다 보니 AI 알고리즘에 대한 지식이 부족하여 다소 난해하게 질문드리게 된 점 정말 죄송합니다.. 또 하드웨어적 관점에서 생각하다보니 알고리즘 부분과는 다소 동떨어진 질문이 있을 수도 있을 것 같은데, 그런 부분이 있다면 죄송합니다 ㅠㅠ몇 년전, 동아리 활동을 하면서 머신러닝에 관심을 갖게 되어 선생님의 강의를 수강하고, 잘 공부했었던 기억이 있어 이렇게 다시 찾아 질문 드리게 되었습니다.긴 내용 읽어주셔서 감사드립니다..

90909090001 · 2024.12.23 · 딥러닝 CNN 완벽 가이드 - TFKeras 버전

투표점수

0

조회수

215

답변

1
미해결
파이썬을 활용한 머신러닝 딥러닝 입문

MAtplotlib 기초

OOP style 부분에서 자꾸 name 'fig' is not defined라고 오류가 나는데 어떻게 해결하나요..?

한유진 · 2024.12.21 · 파이썬을 활용한 머신러닝 딥러닝 입문

투표점수

0

조회수

123

답변

1

인기 태그

주간 인기글