묻고 답해요
164만명의 커뮤니티!! 함께 토론해봐요.
인프런 TOP Writers
-
미해결[개정판] 파이썬 머신러닝 완벽 가이드
선형회귀 모델을 위한 데이터변환
안녕하십니까! 선생님선형회귀 모델을 위한 데이터 변환에서 스케일링을 한 데이터에 다시 다항 특성을 적용하여 변환을 적용해준다고 하셨는데 , 이때 다항 특성을 적용하는 이유가 다항 회귀 곡선으로 표현한 것이 더 예측성능이 높기 때문에 적용을 해주는 것인지? 또 다항 특성을 적용했을 때 무조건 성능이 올라 가는 것이 아니라 과소적합이나 과대적합의 위험성도 있는지 궁금합니다!
-
해결됨처음하는 딥러닝과 파이토치(Pytorch) 부트캠프 (쉽게! 기본부터 챗GPT 핵심 트랜스포머까지) [데이터분석/과학 Part3]
from_pretrained 에 관한 질문입니다
강의 4:53 에 나오는 from_pretrained 함수에 관한 질문입니다.공식 문서를 아무리 찾아봐도, 더 미궁 속으로 빠지는 듯한 느낌만 들어서(...) 질문 올립니다. from_pretrained 메소드는 huggingface에서 제공하는 그 어떠한 클래스에도 공통적으로 적용이 가능한 것인지 궁금합니다.공식 문서에서 from_pretrained를 검색해본 결과, 각 검색 페이지마다 from_pretrained의 파라미터가 다르게 나오고, 그에 대한 설명조차도 찾을 수가 없었습니다...예를 들어, FeatureExtractionMixin 의 from_pretrained 메소드의 파라미터는 9개인 반면, AutoTokenizer의 from_pretrained 메소드의 파라미터는 13개 라고 서술되어 있는 경우를 볼 수 있었습니다.또한, 강의에서 사용하였던feature_extractor = ViTFeatureExtractor.from_pretrained("google/vit-base-patch16-224-in21k") feature_extractor이 코드와,model = ViTForImageClassification.from_pretrained('google/vit-base-patch16-224-in21k', num_labels=10, # 10개의 클래스로 분류를 해야 함 id2label=id2label, label2id=label2id)이 코드에서도 역시 from_pretrained 메소드가 사용되었는데,공식 문서에서 ViTFeatureExtractor와 ViTForImageClassification을 아무리 찾아보아도 from_pretrained 메소드에 관한 설명은 볼 수가 없었으며, 각각의 경우에 적용되는 파라미터에 관한 내용 역시 찾아볼 수 없었습니다.이런 경우, 다른 코드에 from_pretrained 메소드를 적용할 때에는 해당되는 내용을 어떻게 찾아야 하는 것인지 궁금합니다.
-
미해결비전공자를 위한 진짜 입문 올인원 개발 부트캠프
콜백 함수 질문
콜백함수에서 첫번째 함수 선언했을때 나중에 그냥 sayHello()로 호출하면안되나요? 굳이 함수를 새로 만들어서 거기 인자에 콜백함수 넣고, 함수이름(sayHello)를 실행시키는 이유가 궁금해요~~
-
해결됨[개정판] 딥러닝 컴퓨터 비전 완벽 가이드
CVAT 툴 사용
안녕하세요, 강사님.한줄기 빛처럼 따라가며 강의 잘 듣고있습니다! 정말 감사드립니다.섹션10. Ultralytics Yolo 실습 - 02에서 CVAT 툴을 소개해주셨는데강의 안에서 말씀해주신 cvat.org 페이지는 접속이 불가하던데 혹시 cvat.ai로 바뀐걸까요?
-
해결됨[개정판] 파이썬 머신러닝 완벽 가이드
하이퍼 파라미터 튜닝 관련 질문 드립니다
안녕하세요 선생님. 좋은 강의 감사합니다.다름이 아니라 혹시 회귀의 경우도 hyperopt를 사용하여 하이퍼 파라미터 튜닝이 가능한지 궁금하여 질문을 드립니다.강의에서 다뤄주지 않으셔서 질문 드립니다!
-
미해결딥러닝 CNN 완벽 가이드 - TFKeras 버전
안녕하세요 선생님 질문입니다!
강의 내용에서 이터레이션이 1000이고 전체 데이터수가 10만이라면 단순히 연산량으로 봤을 때 10만건의 데이터를 각각 1000번씩 돌려서 웨이트를 업데이트 한다라는 의미가 맞나요?
-
해결됨[개정판] 파이썬 머신러닝 완벽 가이드
강의 마지막 부분 모델 성능 관련 질문
안녕하세요 선생님. 먼저 좋은 강의 감사드립니다.제가 질문을 드리는 이유는 다름이 아니라 모델을 선택하는것과 관련되어 질문이 있어 드립니다.강의 마지막 정도 부분에 데이터 셋마다 좋은 성능을 나타내는 모델들이 다를 수 있다고 하셨는데, 그러면 예를 들어 아래와 같이lr_reg = LinearRegression()ridge_reg = Ridge(alpha=10)lasso_reg = Lasso(alpha=.01)rf_reg = RandomForestRegressor(n_estimators=500)gbm_reg = GradientBoostingRegressor(n_estimators=500)xgb_reg = XGBRegressor(n_estimators=500)lgbm_reg = LGBMRegressor(n_estimators=500)이렇게 모든 모델 객체를 반복문을 통해서 다 성능을 한 뒤에, 가장 좋은 성능을 보인 모델의 하이퍼 파라미터를 조정해서 더 성능을 높이는 방향으로 가야하는 것인가요? 제가 아직 머신러닝의 전체적인 과정에 대한 지식이 부족해 이렇게 질문을 드립니다.감사합니다:)
-
미해결[개정판] 파이썬 머신러닝 완벽 가이드
3차 다항식 만들기
선생님! 다항회귀공부하면서 코드에 3차 다항식을 만들 때 y = 1 + 2*X[:,0] + 3*X[:,0]**2 + 4*X[:,1]**3저기 [:,0] 이부분은 식에 왜 해주는 건가요??
-
해결됨수학 없이 시작하는 인공지능 첫걸음: 기초부터 최신 트렌드까지
강의자료 PDF파일과 실습자료 어디서 구하나요?
강의자료 PDF파일과 실습자료 어디서 구하나요?강의 페이지 찾아봐도 어디서 받는지 알 수 없어서 이렇게 질문을 남깁니다.
-
미해결비전공자/입문자를 위한 Data Science(DS)와 AI 학습 & 취업 가이드
강의 자료 부탁드립니다!
안녕하세요. 이제 강의를 듣기 시작했습니다!강의를 더욱 잘 이해하기 위해서 강의 자료를 요청 드립니다.yhj9855@naver.com 으로 자료 보내주시면 감사하겠습니다.
-
미해결[개정판] 파이썬 머신러닝 완벽 가이드
precision_recall_curve() 관련 질문드립니다.
안녕하세요, 좋은강의 감사합니다. precision_recall_curve() 함수를 이용해서,y값과, 예측 값을 넣어주었을때리턴되는값이 정밀도, 재현율, thresholds 값이 반환이 되는것으로 확인했습니다.여기서 궁금한 부분이 thresholds값의 변화는함수에서 임의로 진행 되는것 일까요?
-
해결됨[개정판] 딥러닝 컴퓨터 비전 완벽 가이드
pretrained model 재학습 관련 질문
안녕하세요.tensorflow object detection 공부 중 몇 가지 궁금증이 생겨 질문드립니다. pretrained model을 이용해 "사과"라는 객체를 탐지하는 A모델을 만들었을 경우, 이 A 모델에 추가적으로 "바나나"라는 객체를 학습 시켜, 최종적으로 "사과","바나나"를 탐지하는 A모델을 만들 수 있는지 궁금합니다.만약, 1번이 가능하다면,기존 A모델의 labelmap에 id를 추가하여 "바나나" 입력기존 A모델의 config 파일에 num class를 2로 변경, "바나나" 학습 데이터(tfrecord) 위치로 변경하면 되는 걸까요?만약, 1번이 가능하지 않다면,"사과" tfrecord와 "바나나"tfrecord를 합쳐서 새로운 tfrecord를 만들고pretrained model를 불러와 새로운 B 모델을 만들어야 할까요?
-
미해결[개정판] 딥러닝 컴퓨터 비전 완벽 가이드
kaggle 에서 cpu 설정 하는 창이 보이지 않아요.
kaggle 에서 cpu 설정 하는 창이 보이지 않아요.창이 잘못 닫힌것 같은데 다시 띄우려면 어떻게 해야 될까요?
-
미해결[개정판] 파이썬 머신러닝 완벽 가이드
CSR 구현 시 0이 아닌 데이터의 row가 비규칙적으로 존재할 때?
안녕하세요 선생님!CSR 형식이 행 위치 배열 내에 있는 고유한 값의 시작 위치만 다시 별도의 위치 배열로 갖는 변환 방식이라고 설명해주셨는데, 0이 아닌 데이터의 row가 비규칙적으로 존재할 때는 CSR 방식을 쓸 수가 없나요? 쓸 수 있다면, 행위치 배열의 고유값 시작 인덱스 배열 뿐만 아니라 각 고유값이 무슨 값인지(몇번 째 행인지)에 대한 정보도 다른 곳에 저장되어 있는건지 궁금합니다! 예를들어, COO 방식으로 구현 시 행위치 배열이 [0, 0, 5,5,5,5,6,6,6,6,6] 일 때, CSR 방식에서는 행위치 배열의 고유값 시작 인덱스 배열이 [0, 2, 6] 일텐데 해당 정보만으로는 3행으로 이루어진 밀집행렬로 유추할 위험이 있을 것 같아서요!
-
해결됨[개정판] 딥러닝 컴퓨터 비전 완벽 가이드
object detection 거리 감지를 위한 질문 (YOLO V5)
안녕하세요. 철민 강사님께 늘 좋은 강의 내용에 감사하면서 오늘도 질문을 드립니다. object detection 에서 물체 간의 거리 감지를 위한 질문 (YOLO V5)을 드리려고 합니다. 강의에서 배운 내용을 바탕으로 입력 영상으로 실시간 객체간의 거리를 측정하는 기능을 개발하고 있는데 아래와 같이 중장비와 사람간의 바운딩 박스의 가운데 좌표를 읽어 거리를 측정하고 있는데 근본적이 오류가 있었습니다. 오류사람의 위치가 이동하여 중장비 옆에서 잡은 거리가 2m라고 했을 때 뒤에서 잡은 거리는 2.7m가 되고 위에 지점에서 잡은 거리는 3.8미터가 되는 오류가 있습니다. 이 문제를 해결하기 위해 바운딩 박스의 가장 중심점 에서 거리를 측정 오류를 벗을 수는 없는 것인가요? semantic segmentation 픽셀 단위 이미지를 이용하면 되지만 이 경우에는 사람이 너무 가까이 가면 하나로 클래스로 인식하고 이것을 Instance Segmentation 으로 해결하려고 하는데 GPU 연산의 하드웨어적인 한계가 있었습니다. object detection 알고리즘으로 객체 간 위치별 거리측정의 오차를 없앨 수 있는 방법에 대해서 조언을 부탁드립니다.
-
미해결처음하는 딥러닝과 파이토치(Pytorch) 부트캠프 (쉽게! 기본부터 챗GPT 핵심 트랜스포머까지) [데이터분석/과학 Part3]
out = out[:, -1] 코드에 관한 질문입니다
강의 8:30 부분에서 나오는out = out[:, -1] 코드에 관한 질문입니다. 우선, 다음과 같이 예시를 작성해 보았습니다이렇게 test_data를 만들고, 여기에 test_data[:, -1] 을 적용해 보았는데요,shape이 (3, 2, 4) 에서 (3, 4) 로 바뀌는 것은 확인하였지만, 이 코드가 '왜 사용되었는지' 에 관한 궁금증이 생겼습니다. 단지 shape을 맞춰주기 위해서 전체 데이터 중 일부를 slicing 하는 것이라면, view 메소드를 사용해서 shape을 맞춰주는 방법도 있을텐데요,전체 데이터 중에서 일부를 slicing 하는 방식으로 이렇게 코드를 작성한 이유가 무엇인지 궁금합니다!
-
미해결[개정판] 파이썬 머신러닝 완벽 가이드
안녕하세요 선생님 질문입니다!
선생님 안녕하세요 알고리즘을 공부하고 다시 들으니 이해가 더 잘 되는 것 같습니다. 이제 막 분류에 대한 마지막까지 들었는데 제가 이해한 부분이 맞는지 모르겠습니다. 결정트리는 머신러닝의 한 방법이다.정확도를 높이기 위해서 앙상블 기법(여러가지 머신러닝을 섞거나, 데이터를 부트스트래핑 등)을 쓴다.대표적인 앙상블 기법으로는 배깅과 보팅, 부스팅이 있는데, 배깅에서는 여러가지 결정트리로 되어있는 랜덤포레스트 방식, 보팅은 서로 다른 머신러닝들로 학습하는 것, 부스팅은 약한 분류기를 순차적으로 학습하면서 전에 학습했던 특정데이터에 가중치를 두어 점차적으로 학습하는 방식스태킹은 분류된 데이터를 가지고 다시 한번 하나의 머신러닝 기법으로 학습한다. (하지만 학습에 테스트데이터를 쓰기때문에 오버피팅이 발생)이 정도로 머릿속으로 정리를 했는데 틀린 것이 있는지, 또는 보팅을 할때 다른 머신러닝 여러개와 결정트리 여러개 로 구성된 앙상블 모델도 랜덤포레스트라고 부를 수 있는지가 궁금합니다
-
미해결[파이토치] 실전 인공지능으로 이어지는 딥러닝 - 기초부터 논문 구현까지
register_forward_hook을 활용한 피쳐맵 추출에서 문제가 발생합니다ㅠㅠ
안녕하세요. 현재 코랩환경에서 파이토치 제공 Mask-RCNN을 활용하고 있습니다. 강의에서 알려주신 Hook를 활용하여 중간 레이어의 피쳐맵을 추출하고자 진행하던 과정에서 문제가 발생하여 질문드립니다ㅠㅠ모델은 제가 가진 데이터셋에 맞춰 출력층을 바꾸어준 후에 학습을 완료한 상태입니다. 이후 for문을 통해 모델에 여러 입력 이미지들을 넣어주어 이미지별 중간 레이어의 피쳐맵을 얻으려고 하였으나, 출력결과 하나의 이미지에 대한 피쳐맵만 반복적으로 출력되는 문제가 발생합니다...모델 학습 및 가중치 로드 후 코드는 다음과 같습니다.Hook 함수def get_activation(name): def hook(models, input, output): activation[name] = output return hook입력 이미지별 피쳐맵 저장activation = {} device = torch.device("cuda:0" if torch.cuda.is_available() else "cpu") models.to(device) for i in range(1, 5): test_img = Image.open("입력 이미지 루프").convert('RGB') test_img = test_img.resize((800, 800)) test_img = tr.functional.to_tensor(test_img) test_img = test_img.reshape(1, 3, 800, 800) with torch.no_grad(): models.eval() models.backbone.fpn.extra_blocks.register_forward_hook(get_activation("fm{}".format(i))) test_img = test_img.to(device) models(test_img)출력 결과activation["fm1"] 부터 ["fm4"] 까지 동일한 값이 들어가 있음아무리 찾아보고 여러 시도를 해보아도 해결이 되지않아 답답하네요ㅠㅠ추가로 위의 코드를 한번 돌리면 런타임을 다시 시작하지 않는 이상 이후에 코드를 수정하여 hook 함수부터 다시 돌려도 적용이 되지 않는 문제도 발생합니다...
-
미해결[개정판] 파이썬 머신러닝 완벽 가이드
강의 (3:38)에서 GridSearchCV 관련 질문
안녕하세요 선생님. 먼저 좋은 강의 감사합니다.다름이 아니라 제가 GridSearchCV를 통해 랜덤 포레스트 코드를 실행하였는데 제가 첨부한 사진과 같은 오류가 나왔습니다.결과는 문제 없지 나왔지만 어떤 부분에 문제가 생겼는지 궁금하여 질문을 드립니다.제가 예상하기로는 선생님의 get_human_dataset()에서 y_train이 데이터 프레임 형식으로 추출이 되는데, 여기서는 시리즈 형태 혹은 ndarray 형태로 넣어야 되는 건지 추측을 해봅니다.감사합니다.
-
해결됨유니티 머신러닝 에이전트 완전정복 (기초편)
여러 Area를 동시에 학습
안녕하세요, Drone 강의 부분에서, Area를 GridWorld에서 했던 것처럼 여러 Area를 복사하여 한 씬에 넣고 동시에 학습시키면 step이 빨리 오르는 효과를 볼 수 있을 것 같다고 생각했습니다. 한 area를 여러 개 복사한 뒤에 학습을 진행하려 했는데, 다음과 같은 오류로 잘 되지 않았습니다. 어떻게 해결해 볼 수 있을까요? critic_loss = F.mse_loss(target_q, q)Traceback (most recent call last): File "DDPG.py", line 240, in <module> actor_loss, critic_loss = agent.train_model() File "DDPG.py", line 144, in train_model reward = np.stack([b[2] for b in batch], axis=0) File "<__array_function__ internals>", line 6, in stack File "C:\Users\anaconda3\envs\mlagent2\lib\site-packages\numpy\core\shape_base.py", line 426, in stack raise ValueError('all input arrays must have the same shape')ValueError: all input arrays must have the same shape