묻고 답해요
164만명의 커뮤니티!! 함께 토론해봐요.
인프런 TOP Writers
-
미해결혼자 공부하는 머신러닝+딥러닝
순환 신경망의 순환층의 가중치에 대해 질문이 있습니다
강사님 언제나 친절한 답변에 감사드립니다.다름이 아니라 순환층의 가중치에 대해 질문이 있습니다영상 강의에서는 가중치 Wh, Wx를 설명해주실 때 Wx는 샘플마다 동일하게 사용되고, Wh는 타임스텝마다 동일하게 사용된다고 말씀해 주셨습니다. 그런데 492p의 세번째 문단에서 '모든 타임스텝에 사용되는 가중치는 Wh 하나라는 점 입니다'라는 설명에서 혼선을 느끼고 있습니다. 이미지를 참고하였을 때는 결국 매 스텝마다 입력에 대한 Wx, 이전 은닉상태에 대한 Wh 모두 사용하는 것으로 이해가 생각이 되는데 어떤 차이점이 있어서 이렇게 설명해주신걸까요?또 타임 스탭 1...3까지는 순환층 내부의 각각의 뉴런으로 이해되는데, 그렇다면 각각의 뉴런이 모두 동일한 Wx와 Wh를 가진다는 말씀이실까요? 아니면 Wx는 뉴런 별로 고유하되 Wh만 동일하다는 말씀이실까요? 493p에서 Wh의 개수가 9개라는 말이 Wh는 '하나의 값'이 아니라 각각의 뉴런이 다른 뉴런에게 전달한 각각의 값이기 때문에 각 뉴런에 3개씩 있다고 이해하는 것이 정확한지도 궁금합니다.또 타임스텝의 순서는 임의의 순서대로 1,2,3 이렇게 정해지는 것인지 여러가지 방법이 있는지도 궁금합니다
-
해결됨[파이토치] 실전 인공지능으로 이어지는 딥러닝 - 기초부터 논문 구현까지
안녕하세요! 불균형 데이터 처리 과정중 augmentation에 대해 질문이 있습니다
imbalanced data를 처리할 때, weightedrandomsampler (replacement=True) 와 augmentation을 통해 불균형을 해소하고자 하는데, weightedrandomsampler에 있는 num_samples 파라미터에 관해 궁금한점이 있어서 질문드립니다. weightedrandomsampler가 작동하는 방법이, 샘플마다 가중치를 줘서 데이터 수가 적은 라벨에서는 더 높은 확률로 뽑히고, 데이터 수가 많은 라벨에서는 더 낮은 확률로 뽑혀서 결국 확률상 거의 같은 확률로 뽑도록 만들어서 불균형을 해소하는 걸로 알고 있습니다.이때, 만약 num_samples를 그냥 원래 train_sets의 길이로 지정을 하면 데이터가 적은 라벨에서는 augmentation을 통해 이미지를 변형해가며 오버샘플링이 된 것 처럼 샘플수가 증가되겠지만, 반대로 원래 데이터가 많던 라벨에서는 기존에 있던 데이터들에서 일부는 뽑히지 않을 수도 있지 않나요?예를들어 (1000,200,100)의 불균형 데이터가 있다고 했을때, 전체 데이터의 개수인 1300만큼 weightedrandomsampler에서 num_samples=1300으로 하고 추출을 한다면, 라벨별로 1300/3 = 433개씩 뽑힐텐데, 이러면 첫번째 라벨의 데이터는 1000개에서 433개를 뺀 567개는 그대로 누락되는건가요?만약 그렇다면 num_samples를 더 큰 숫자로 해서 가지고 있는 데이터를 전부 불러오려고 한다면, 소수의 데이터를 너무 많이 재활용해서 과적합이 될까요?
-
미해결비전공자를 위한 진짜 입문 올인원 개발 부트캠프
코드가 잘못 됐나요..
코드가 잘못 됐나요..상품 목록이 나오질 않네요..#1 vsCode<html> <head> <title>TerretAccompany</title> <link href="index.css" type="text/css" rel="stylesheet" /> <script src="https://cdn.jsdelivr.net/npm/axios/dist/axios.min.js"></script> </head> <body> <div id="header"> <div id="header-area"> <img src="images\icons\logo.png" /> </div> </div> <div id="body"> <div id="banner"> <img src="images\banners\banner1.png" /> </div> <h1>판매되는 상품들</h1> <div id="product-list"></div> </div> <div id="footer"></div> </body> <script> axios .get("https://2007f5d2-9d8b-49f0-8b70-032507e17d79.mock.pstmn.io") .then(function (result) { console.log("통신 결과 : ", result); const products = result.data.products; let productsHtml = ""; for (var i = 0; i < products.length; i++) { let product = products[i]; productsHtml = productsHtml + '<div class="product-card">' + "<div>" + '<img class="product-img"' + 'src="' + product.imageUrl + '" />' + "</div>" + '<div class="product-contents">' + "<!-- text를 넣을때 많이 씀 -->" + '<span class="product-name">' + product.name + "</span>" + '<span class="product-price">' + product.price + "원" + "</span>" + '<div class="product-seller">' + '<img class="product-avatar" src="images/icons/avatar.png" />' + "<span>" + product.seller + "</span>" + "</div>" + "</div>" + "</div>"; } document.querySelector("#product-list").innerHTML = productsHtml; }) .catch(function (error) { console.error("error 발생 : ", error); }); </script> </html> #2 postman{ "products" : [ { "name": "농구공", "price": 500000, "seller": "조던", "imageUrl": "images/products/basketball1.jpeg" }, { "name": "축구공", "price": 600000, "seller": "메시", "imageUrl": "images/products/soccerball1.jpg" }, { "name": "키보드", "price": 300000, "seller": "그랩", "imageUrl": "images/products/keyboard1.jpg" } ] }
-
미해결[개정판] 파이썬 머신러닝 완벽 가이드
5장 회귀 Kaggle 보스턴 집값 예측 실습
안녕하십니까. 현재 완강 후 복습하고 있는 학생입니다!5장 회귀 파트 Kaggle 보스턴 집값 예측 실습을 하던 중 궁금한 것이 생겨 질문드립니다. Kaggle에서 데이터를 받으면 train.csv와 test.csv가 있는데 처음 모델링을 진행할 때 train 데이터를 활용하여 진행했더니 test 데이터로 predict를 할 수 없었습니다.알아본 결과 train 데이터셋으로 더미변수를 생성한 경우 test 데이터셋을 더미변수로 인코딩 했을 때 matching이 되지 않아 predict가 안되는 것 같았습니다.따라서 train 데이터셋과 test 데이터셋을 합쳐서 새로운 데이터프레임(all_data)을 생성하여 모든 전처리 과정을 다시 진행하고 더미변수 생성 후 train 데이터셋과 test 데이터셋으로 다시 분리를 해줬습니다.이후 재분리된 train 데이터셋을 train_test_split 으로 분할한 후 모델링을 진행하고 마지막에 all_data 에서재분리했던 test 데이터셋을 활용하여 model.predict(test) 를 통해 submission.csv 를 만들 수 있었습니다. 이런 과정을 진행하며 궁금한 점은 현업에서 만약 지금까지 수집된 데이터로 모델링을 진행했는데 예측할 데이터에 새로운 범주 혹은 기존 범주 중 새롭게 수집된 데이터가 있는 경우 처음부터 모델링을 다시 진행하는 것인지 아니면 다른 방법이 있는지 궁금합니다. 강의 들으며 정말 실력이 많이 늘었습니다. 복습이 끝나면 SQL 강의도 수강을 계획하고 있습니다. 좋은 강의 만들어주셔서 정말 감사합니다!
-
미해결파이썬을 활용한 머신러닝 딥러닝 입문
true function에 대해 이해가 잘 안되서 질문 남깁니다
학습 데이터를 통해 모델을 학습 시켰을 때 true function이 나오는 건가요? 아니면 학습 데이터를 통해 모델을 만든 이후에 모델의 검증을 위한 검증 데이터를 넣었을 때 true function이 나오는 건가요?ture function이 만들어지는 시기가 언제인가요?
-
미해결처음하는 딥러닝과 파이토치(Pytorch) 부트캠프 (쉽게! 기본부터 챗GPT 핵심 트랜스포머까지) [데이터분석/과학 Part3]
MNIST 데이터 DNN 학습시키는 반복문 안에 minibatch 관련 질문
# 질문 1. 아래와 같이 model 안에 x_minibatch, y_minibatch를 넣고 학습을 시키는 과정인데 결국 train_batches의 차원은 (375,128,1,28,28) # 48000/128=375 x_minibatch 의 차원은 (128,1,28,28) 여기서 model의 input의 차원은 (128,784) 가 맞을까요? 결국 한번 model 넣을 때마다 128개의 data가 학습되는 건가요? DNNModel에는 input 차원이 (784,)인 1개의 데이터가 들어가서 output으로 (10,) 데이터를 출력한다고 알고있어서 조금 개념이 충돌하는 것 같습니다. # 질문 2. train_batches의 type이 torch.utils.data 이라 shape을 알기 어려워 행렬 구조가 눈에 안들어오는데 따로 보는 방법이 있을까요? model.train() # prep model for training for x_minibatch, y_minibatch in train_batches: y_minibatch_pred = model(x_minibatch.view(x_minibatch.size(0), -1)) loss = loss_func(y_minibatch_pred, y_minibatch) optimizer.zero_grad() loss.backward() optimizer.step() train_loss += loss.item() train_loss = train_loss / len(train_batches) train_losses.append(train_loss)
-
미해결유니티 머신러닝 에이전트 완전정복 (기초편)
카트레이싱 환경관련 문의
안녕하세요, 수업은 다 듣고 실습부분만 조금씩 다시 따라가고 있는데요,카트레이싱에서 환경 구축을 다 하고, KartAgent 코드도 깃허브에 있는거 그대로 C# 코드 옮기고, AcadeKart 코드도 수정을 다 했는데, 이상하게 카트가 1번 웨이포인트 지나고 리셋이 됩니다. 파이토치와 유니티 책에는 OnEpisode 함수에 for문이 있는데, 넣고 빼고는 상관이 없더라구요, 웨이포인트를 이어가지 못하거나 중간에 충돌이라고 판단하거나 기타 리셋 조건이 문제인것 같은데, 어딜 봐야 할지 조언을 주실 수 있으신가요?
-
미해결[개정판] 딥러닝 컴퓨터 비전 완벽 가이드
Selective Search를 도면에서 특정 기호 찾는 데 활용할 수 있을까요?
안녕하세요. 선생님의 강의를 열심히 듣고 있는 직장인입니다.다름이 아니라 설계도면에서 특정 기호를 찾아야 하는 업무가 있는데 Selective Search를 이용하여 특정 기호의 이미지를 먼저 인식시키고, 그 다음에 입력되는 도면들에서 해당 기호가 있는 곳을 표시하는 작업을 해보고 싶습니다.해당 방법을 이용하면 될지, 아니면 더 좋은 방법이 있을지 문의드립니다.
-
해결됨혼자 공부하는 머신러닝+딥러닝
은닉 상태에 대한 질문이 있습니다
강사님 언제나 친절한 답변에 감사드립니다.다름이 아니라 490p에 은닉 상태 이미지에 관해 질문이 있습니다.하단의 도움말을 참고하면 '앞의 그림 O도 은닉상태랍니다'라고 적혀있는데, 이 말이 의미하는 것이 두번째 타임스탭부터는 이전 층의 출력이 재사용되기 때문에, 셀도 출력에 포함되는 것으로 생각하면 된다는 말씀이 맞을까요?그 부분이 직관적인 이해가 되질 않습니다
-
미해결파이썬을 활용한 머신러닝 딥러닝 입문
셔플 시, target과 데이터가 섞일 때
제가 강의를 들으며 사이킷런에 iris 샘플을 가지고 data와 target을 나누고 있는 와중에 문득 궁금한 점이 생겼습니다.train_test_split을 통해 train셋과 test셋을 나누게 되는데 shuffle이 True로 되어 있기 때문에 자동적으로 shuffle이 수행되지않습니까? 이 때 샘플데이터와 타겟은 짝을 지어서 셔플이 되는 건가요? 아니면 샘플데이터도 타겟 데이터도 둘 다 아무렇게나 섞이는 건가요?
-
미해결[개정판] 파이썬 머신러닝 완벽 가이드
keepdims warning
스태킹 모델 소개 - 기본 스태킹 3:25 즈음 예측 데이터 셋 생성시 keepdims 관련 warning이 떠서 검색해본 결과, 대충 2 dimension을 유지해야 한다는 걸로 보여서 대수롭지 않게 넘겼습니다.그런데 스태킹 모델 소개 - 교차검증 스태킹 15:55 즈음 모델별 학습을 할 때는 한 페이지를 잡아먹을 정도로 warning 문구가 도배됩니다.내용을 보니 Scipy 1.11.0 이후 keepdims default 값이 False이기 때문에 편의에 따라 keepdims를 True든 False든 지정해두라는 것 같은데, 어느 부분에 추가해야할지 잘 모르겠습니다.어떻게 해결해야 할까요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
일단 등록은 했습니다.
안녕하세요 강사님.오늘 갑자기 빅데이터분석기사 자격증을 취득해야겠다는 생각과 함께 온라인 강의를 알아보고 미리듣기 하다가 오리엔테이션이 제 스타일이셔서 일단 결재를 했습니다.제가 프로그래밍해본적도 없고 완전 입문자예요.이 강의가 물론 도움은 많이 되겠지만 이강의만 듣고 입문자인 제가 쉽진 않을 것 같아요.결론은 필기든, 실기든 추가로 준비할 때 도움이 되는 책이라던지 공부 방향을 설정해주시고 추천해주실 수 있을까요.
-
미해결비전공자를 위한 진짜 입문 올인원 개발 부트캠프
Failed to compile [./src/App.js 12:35-41 문제 원인 좀
어디 쪽에서 문제가 발생 하는지 모르겠습니다.
-
미해결[개정판] 딥러닝 컴퓨터 비전 완벽 가이드
선생님 질문입니다!
3:23 에서 질문을 드리고 있습니다!예측 BBbox 와 positive 좌표차이가 Ground truth와 positive 좌표차이와 같게 만든다고 하셨는데 가령 빨간점이 파랑 점과의 거리 가 같은 곳은 무수히 많다고 생각하는데 단순히 거리를 줄이는 것이 어떤 원리로 regression이되는지 이해가 되지 않습니다.
-
미해결[개정판] 딥러닝 컴퓨터 비전 완벽 가이드
mask 없이 mask-RCNN 사용이 가능할까요??
안녕하세요 선생님,궁금한 점이 생겨 이렇게 질문 남깁니다.지금 torchvision의 faster r-cnn을 이용해서 object detection 프로젝트를 수행하고 있는데여기서 제가 궁금한 점은 2가지 입니다.사용하고 있는 데이터가 mask 정보가 없는, bounding box와 카테고리 정보만 담겨있는 custom data인데 mask정보 없이 mask R-CNN에서도 실행해볼 수 있을까요??mask 정보 없이 mask R-CNN을 사용하는 것은 faster R-CNN을 사용하는 것과 차이가 없을까요?? 1번을 시도하는 것은 의미 없는 일인 것인지 궁금합니다.감사합니다.
-
미해결[개정판] 딥러닝 컴퓨터 비전 완벽 가이드
선생님 질문입니다!
1:01의 그림을 보면서 질문드리고 있습니다!원래 CNN을 거치면 FC layer에 가기전에 여러개의 피처맵을 Flatten 해서 맞춰주는데 지금 그림에서 Conv Network를 통과한 feature 이미지는 하나만 있다고 표현되는데 왜 그런건가요? 제 생각대로라면 Flatten이 되기전에는 여러 피처맵이 있는걸로 알고 있습니다.그리고 이미 vggnet 을 통해서 나온 피처맵을 3*3 conv를 하는 이유를 모르겠습니다. conv를 적용하지 않고 그냥 1*1 conv를 하는 것이 나을거라 생각하는데 이해가 잘 되지 않습니다.
-
미해결혼자 공부하는 머신러닝+딥러닝
합성곱 신경망 파트에 대해 질문이 있습니다.
안녕하세요 강사님. 먼저 늘 유익한 강의에 감사드립니다.다름이 아니라 합성곱에 대해 공부 중 두 가지 의문이 생겨 질문드립니다.1. 451p 신경망 생성을 그림으로 요약한 표 입니다.이미지가 필터를 거칠 때, 필터는 슬라이딩 하듯이 이미지 위를 이동하는 것으로 이해했습니다. 그런데, 몇 차례 이동을 거쳤을텐데 원본과 같은 크기의 이미지를 반환합니다. 반환된 이미지는 어떤 기준으로 계산되는건지 궁금합니다.2. 473p에서 두번째 문단에, '우리에게 필요한 것은 첫번째 conv2D의 출력입니다. model 객체 입력과 conv2D의 출력을 알 수 있다면 둘을 연결하여 새로운 모델을 얻을 수 있지 않을까요?' 부분의 맥락이 이해가 되질 않습니다. 여기서는 왜 새로운 모델을 만들려고 하는걸까요?
-
해결됨캐글 Advanced 머신러닝 실전 박치기
컬럼 관련 질문
안녕하세요 선생님 항상 좋은 강의 감사드립니다.다름이 아니라 수업 마지막 즈음에, 퍼포먼스를 높이기 위해 컬럼을 많이 만든다고 하셨던 말씀에 궁금한 점이 생겨 질문을 드립니다.저번에 다른 수업에서 캐글에서 많은 사람들이 피처(컬럼)의 개수를 많게는 천개도 넘게 만들어놓고 성능을 평가하며 줄인다고 하셨던 걸로 기억을 합니다 (제 기억이 맞다면요!).그렇다면 컬럼을 만들 때 저의 상상 속의 로직?이 필요하다고 생각하는 모든 경우의 컬럼들을 만들어 놓은 다음에 plot importance 그래프에서 성능에 도움이 되지 않는 컬럼들은 drop해도 되는 걸까요? 아니면 성능이 큰 영향을 주지 않더라도 그대로 놔둬야 하는 걸까요?다시 정리해서 말씀드리면, 엄청나게 많은 컬럼들을 만들어 놓은 후에 나중에 성능에 별 도움이 되지 않는 컬럼들은 (순차적으로) drop하는게 맞는 걸까요? 놔둬야 할까요??감사합니다:)
-
미해결[개정판] 파이썬 머신러닝 완벽 가이드
스태킹 모델 메소드의 교차검증
안녕하십니까 선생님 좋은 강의 수강하고 부족한 부분에 대해 강의를 여러번 돌려보고 있습니다.다름아니라 제가 Stacking 앙상블 학습에 관심을 갖고 공부를 진행하고 있는데 sklearn에 StackingRegressor 메소드(?)를 이용한 코드를 작성해 봤습니다. 아래는 작성한 코드 중 메소드 부분입니다.Stacking = StackingRegressor(estimators=estimators, final_estimator=meta_model, cv=10)여기서 cv=10을 이용하면 강의 예시에 나오던 stacking_input_data 함수 정의에서 n_folds를 10한것과 같은 과정으로 이루어지는건가요?
-
미해결[개정판] 딥러닝 컴퓨터 비전 완벽 가이드
multi-class segmentation mask일 때 COCO format으로 변환하는 방법
구글링을 해도 도저히 답을 못 찾겠어서 질문 드립니다. 지금 맡고 있는 프로젝트에서는, 총 4개의 class가 masking되어있는 이미지 형태로 annotation이 준비되어 있고 이걸 json annotation으로 만들어야 하는데 이럴 경우에는 어떻게 해야 하죠?