묻고 답해요
160만명의 커뮤니티!! 함께 토론해봐요.
인프런 TOP Writers
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
너무 기초적인 질문인데요... 강의 중간에 잘라내기는
너무 기초적인 질문인데요... 강의 중간에 잘라내기 단축키가 있을까요 ? ,,,
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
(문의) 섹션2 시계열데이터 코랩링크 없나요 ?
안녕하세요!!!새로추가된 섹션2의 시계열데이터 코랩링크는 없나요 ?감사합니다.
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
print 관련 질문입니다.
안녕하세요 :)작업형 1 제출 시리터럴 값을 프린트하지 말라는 얘기가 있어서 질문드립니다.ex print(3), print('정답')위 예시처럼 제출하면 안 되는 것인가요? (감점 사유인지, 오답 처리인지)혹은 answer = ...codeprint(answer)이와 같은 방식은 가능한 것인지 궁급합니다.print문 안에 함수를 작성하는 것보다 answer에 할당해두고 print 하는 방식이 익숙해서요!감사합니다!
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
3-6 Regression 강의 관련 질문
스케일링을 할 때, minmax scaler랑 standard scaler 는 train,test data의 columns에 스케일링을 하는데 log scaler할 때는 값이 커보여서 내지는 편차가 있어보여서(?) log scaling에 적합해 보이는 타겟인 ['charges'] column에만 하잖아요, 근데 rmse값은 모든 columns에 대한 값인데 하나의 column을 log scaling했다고 np.exp를 씌우는게 왜 괜찮은지에 대해서 궁금합니다.. 해당 강의에서는 train data에만 log scaling을 했는데 왜 얘만 test data에는 안 하는거죠? minmax랑 standard할 때는 train, test 둘 다 했는데 말이죠.. X_train, Y_train, x_test 세 개가 주어지는 경우와 train, test가 주어지는 경우의 차이는 train data의 column에서 타겟을 뽑아 새로 y_train 같은 존재를 제가 만든다는 점만 다르다고 생각하면 될까요? 이거 말고 주의해야 될 사항이 있나 궁금합니다.이상입니다 !+ 실기 대비용으로 본 강의 탑승한 거 만족하면서 강의 잘 듣고 있습니다 ~ 감사합니다ㅎㅎ
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
수업노트 링크
"수업노트에 링크를 첨부해두었으니 확인해 주세요" 에서 수업노트를 못찾겠네요 ㅠㅠ 오른쪽에 나열된 "커리큘럼, 커뮤니티, 노트. 성장로그, 스크립트" 에서 노트를 클릭해도 링크가 안떠서 혹시 다른 데에 있는지 궁금합니다
-
해결됨처음하는 딥러닝과 파이토치(Pytorch) 부트캠프 (쉽게! 기본부터 챗GPT 핵심 트랜스포머까지) [데이터분석/과학 Part3]
RNN과 LSTM 구현해보기2(MNIST 데이터셋) 강의에서 질문입니다
RNN과 LSTM 구현해보기2(MNIST 데이터셋) 강의의 15:04 부분에서 질문입니다. 강의에서는 다음과 같이 학습 과정에서 반복문을 작성했습니다. # |x_minibatch| = (128, 1, 28, 28) # |y_minibatch| = (128) for x_minibatch, y_minibatch in train_batches: x_minibatch = x_minibatch.reshape(-1, sequence_length, feature_size) y_minibatch_pred = model(x_minibatch) loss = loss_func(y_minibatch_pred, y_minibatch) optimizer.zero_grad() loss.backward() optimizer.step() train_losses.append(loss.item()) 이때, 아래와 같이 loss_func를 적용하는 부분에서 궁금한 점이 있는데요,loss = loss_func(y_minibatch_pred, y_minibatch)y_minibatch_pred 는 model에 x_minibatch 를 넣어서 값을 예측한 것으로, 그 shape이 (128, 10) 과 같이 2차원으로 나온다고 이해하였습니다.반면, y_miinibatch 는 (128) 과 같이 1차원으로 나오는 것을 확인했습니다. 이렇게 loss_func 안에 넣는 두 텐서의 다른 것으로 보이는데, y_minibatch의 shape을 변형해 줘야 하는 것은 아닌지 여쭙고 싶습니다..!
-
미해결[파이토치] 실전 인공지능으로 이어지는 딥러닝 - 기초부터 논문 구현까지
역전파 내용 중 미분 관련 질문 드립니다
안녕하세요, 섹션2의 역전파 수업을 듣다가 궁금한 점이 생겨서 질문 드립니다. 5분 30초에서 L을 zi에 대해서 미분하면 n분의 1이 된다고 하셨는데 그 이유가 i번째 엘리멘트만 고려해서 미분이 되기 때문인가요? 즉, 1/n*zi라서 미분값이 1/n인건지 궁금합니다!
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
데이터 다운로드 관련
안녕하세요? 선생님!이원분산분석 강의의 데이터가 다운로드가 되지 않습니다.확인 부탁드립니다.
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
6회 기출 관련 문의
6회 기출 문제 관련 강의 올려 주셔서 감사드립니다.6회 기출의 작업형1 과 작업형 2의 데이터가 열리지 않아서 다운을 받을 수 없습니다.확인 부탁드립니다.감사합니다.
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
캐글 T2-4. House Prices (Regression)문제 관련해서 질문드립니다.
submission = pd.DataFrame(data={ 'Id': y_test.Id, 'income' : prediction })제출할 때 y_test의 ID값을 불러와서 제출해도 되는건가요? 이 문제에서는 아래처럼 결측치 처리를 해서 y_test의 ID값을 불러오신거 같은데 헷갈려서요 ㅠㅠ X_test를 pd.read_csv로 다시 불러온 다음에 ID값만 추출해서 제출해야 하는게 아닌가해서 질문드립니다from sklearn.impute import SimpleImputer imp = SimpleImputer() X_train = imp.fit_transform(X_train) X_test = imp.transform(X_test)
-
미해결[개정판] 파이썬 머신러닝 완벽 가이드
임곗값에 따른 정밀도-재현율 값 추출
선생님 안녕하세요.임곗값에 다른 정밀도-재현율 추출시, 예측확률 추출(predict_proba)에 대해서 궁금한 점이 있습니다.# predict_proba( ) 반환값의 두번째 컬럼 , 즉 Positive 클래스 컬럼 하나만 추출하여 Binarizer를 적용 pred_proba_1 = pred_proba[:,1].reshape(-1,1)작성해주신 코드는 positive일 확률에 대한 컬럼 하나만 추출한것으로 보이는데, 그 이유가 있을까요?강의를 두세번 반복해서 봐도 이해가 가지않습니다.. 그리고 작성해주신 주석은 'Positive 클래스 컬럼' 이라고 써주셨는데, 데이터를 print해보면 positive 일 확률이기때문에, positive가(1이) 아닐 확률 데이터도 많이 포함되어있어서요. 정확히 어찌 이해하는게 맞을까요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
성능 수치에 관한 질문
작업형2 모의문제1 27:08초 안녕하세요. 모델의 성능 수치가 0.989404816...이었다가 0.98997073,,,으로 좀 더 좋아졌다고 하셨는데요..문돌이인 제가 보기에는 그냥 다 같은 98%로밖에 안보기든요..ㅠ 98.94%든 98.97%든 그게..시험에서 큰 영향이 있는건가요?ㅠ 시험에서 저런 미세한 차이가 작업형 2번 문제를 40점을 받느냐, 0점을 받느냐를 좌우하는건가요?시험문제 조건에서 'roc-auc 80% 이상일 것'이라고 적혀있으면 98.94%든 98.97%든 모두 40점을 주는게 아닌가요?즉..98.94%면 35점이고, 98.97%는 40점인건가요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
범주형변수를 포함한 다중선형회귀 모델에서 독립변수 사용 방식
강의 중 ols함수를 ols('매출액 ~ 광고비 + 유형_A + 유형_C', data=df2).fit() 이런식으로 범주형 변수의 일부 컬럼만 사용해서 회귀모델을 구축할 수 있다고 하셨습니다.그래서 테스트를 해 본 결과 위와 같이 유형_A와 유형_C를 회귀모델의 독립변수로 활용하기 위해서는df = pd.get_dummies(df, drop_first=True)이런식으로 다중공선성 방지를 위한 파라미터를 추가하는게 아니라 위 캡처본에서의 df2와 같이 전체 변수가 포함된 데이터프레임을(유형_A, 유형_B, 유형_C 가 전부 포함된 데이터프레임) 사용해야 하는 것을 알았습니다. 근데, 이렇게 df2와 유형_A, 유형_C를 활용한 회귀모델은 유형_B를 감안한 것이 아니라 그냥 유형_B만 갑자기 누락해버린 회귀모델이 아닐지 문의드립니다. import pandas as pd df = pd.DataFrame({ '매출액' : [300, 320, 250, 360, 315, 328, 310, 335, 326, 280, 290, 300, 315, 328, 310, 335, 300, 400, 500, 600] , '광고비': [70, 75, 30, 80, 72, 77, 70, 82, 70, 80, 68, 90, 72, 77, 70, 82, 40, 20, 75, 80] , '플랫폼': [15, 16, 14, 20, 19, 17, 16, 19, 15, 20, 14, 5, 16, 17, 16, 14, 30, 40, 10, 50] , '투자':[100, 0, 200, 0, 10, 0, 5, 0, 20, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0] , '유형':['B','B','C','A','B','B','B','B','B','B' ,'C','B','B','B','B','B','B','A','A','A'] }) df = pd.get_dummies(df, drop_first=True) from statsmodels.formula.api import ols model = ols('매출액 ~ 광고비 + 유형_B + 유형_C', data=df).fit() print(model.summary()) 위에서는 엄연히 유형_A도 감안된 것일텐데 이런 상황에서 유형_A를 회귀모델 독립변수로 쓰지 않은 것과는 (매출액 ~ 광고비 + 유형_B + 유형_C) 다른 결인 것 같아서요!
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
대응표본검정 실습문제 중 심화문제
제공해주신 쥬피터노트북에서 귀무가설의 부등호 방향이 반대인 것 같은데 혹시 맞을까요?
-
미해결현업 실무자에게 배우는 Kaggle 머신러닝 입문 - ML 엔지니어 실무 꿀팁
강의자료
강의 자료 어딧나요 실습자료 !!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!1
-
미해결[개정판] 딥러닝 컴퓨터 비전 완벽 가이드
엥커박스 크기 및 중복 생성 방지에 관한 질문
좋은 강의 찍어주셔서 감사합니다. 해당 강의를 토대로 공부를 하며 모델을 제작 중에 학습 후 inference_detector을 돌리고 나면 같은 물체를 여러번 잡는 문제가 발생합니다. 또한 이용중인 이미지의 크기가 작아서 인지 엥커박스의 크기가 전체 화면을 잡아주는 경우가 발생하고 있습니다. 그래서 이를 방지하고자 rpn_head의 anchor_generator를 수정해보았으나 학습이 안되는 모습을 관찰하였습니다. 사용 모델 :faster_rcnn_r50_caffe_fpn_mstrain_3x_coco.py 이때 사용 이미지의 class는 1개였습니다. 어떤 식으로 이것을 수정할 수 있을까요? 또한 어디 부분의 강의를 들었을 때 이와 관련된 내용을 알 수 있을까요?감사합니다.
-
미해결[개정판] 파이썬 머신러닝 완벽 가이드
feature X 와 target y
feature 표현할 때는 대문자를 써서 X_train 으로 하고target 표현할 때는 소문자를 써서 y_train 으로 작성이 되고 있는데요.대소문자를 구별해서 사용하고 있는 특별한 사유가 있나요?
-
미해결[개정판] 파이썬 머신러닝 완벽 가이드
안녕하세요 강의를 구매해서 잘 듣고있습니다
안녕하세요 강의를 구매해서 잘 듣고있습니다. 혹시 책도 같이 구매를 해야 원활한 학습이 될까요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
결측치 삭제 시 질문
데이터 전처리시 결측치가 있는 컬럼 삭제하는 경우 삭제의 기준이 있나요?! 영상에서는 기준이 없다고 하셨는데 어떤 기준으로 데이터를 삭제하거나, 결측치를 채우시는건가요?!질문결측치 처리시 데이터를 삭제 혹은 채우기를 하는가 그냥 무작위로 해도 무방한지 궁금합니다. 삭제 시 train데이터의 개수와 비슷한 수를 가지고 있는 데이터를 삭제 하시는건가요?!세션5 작업형2 2번째 문제에서는 결측치가 없는 컬럼(host_id)도 삭제 하셨는데 결측치가 없는 컬럼을 삭제해도 무방한가요?결측치 삭제, 채우기 시 강사님만의 기준이 있으신가요ㅜㅜ
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
단일표본검정은 양측검정이다?
본 강의 5분정도쯤에 단일표본검정은 양측검정이다라고 하셨던거 같은데, 단일표본검정이 양측검정이라는 말이 좀 이해가 안가는데요. 혹시 말씀하신 의도가 scipy의 단일표본검정 API의 파라미터 디폴트값이 양측검정이고 (즉, alternative = 'two-sided'), 단측검정의 단일표본검정을 하고싶으면 파라미터값을 조정해야한다는 의미가(alternative = 'greater 또는 less' ) 맞으실까요?'단일표본검정 = 양측검정'은 아닐 것 같아서요!