묻고 답해요
164만명의 커뮤니티!! 함께 토론해봐요.
인프런 TOP Writers
-
미해결실리콘밸리 엔지니어에게 배우는 파이썬 아파치 스파크
스트리밍 window 관련 질문드립니다.
spark streaming을 설명하시면서 광고로그를 join? 하는걸 예시로 들어주셨는데요, 노출이랑 클릭이랑 interval이 10분~30분 정도가 아니라 7일 이렇게 되는 경우에도 spark streaming으로 처리가 가능한가요?? 궁금합니다.
-
미해결[개정판] 딥러닝 컴퓨터 비전 완벽 가이드
Mask RCNN 성능지표
안녕하세요, 강사님!Mask RCNN 성능지표 관련해서 질문이 있습니다. 보통 classification 논문에서는 성능지표를 confusion matrix, accuracy, precision, recall, f1 score로 많이 쓰던데 semantic segmentation 논문에서는 mAP, mIoU, pixel accuracy를 많이 쓰나요? 논문마다 쓰는 지표가 다른 것 같아서 보편적으로 쓰는 성능 지표가 궁금합니다. 강의에서는 segmentation 성능지표 코드가 없어서 detection 강의 쪽 코드를 보면서 조합해보고 있는데 커스텀 데이터셋을 config나 registry에 등록해주는 과정이 필요한가요?
-
미해결딥러닝 CNN 완벽 가이드 - TFKeras 버전
새로운 데이터셋에 훈련된 가중치 적용
선생님 안녕하세요. 항상 좋은 강의 잘 듣고 있습니다.두가지 질문이 있습니다.선생님께서 18:21에 좋은 성능을 보여준 이유로 imagenet의 가중치를 사용해서라고 말씀 하셨는데, imagenet의 훈련된 가중치는 애초에 cat and dog와 완전히 다른(imagenet에 많은 강아지와 고양이 이미지가 있다고 하더라도) 데이터로 만들어진 결과인데, cat and dog 데이터 셋에 적용해도 높은 정확도가 나오는 이유가 궁금합니다.그리고, 개인적으로 인도 새 25종을 분류하는 모델을 만들고 있는데그렇다면 강의와 같이 imagenet의 가중치를 가져와서 훈련하는 것이 아무것도 없는? 가중치로 훈련하는 것보다 좋은 성능 만들어 낼까요?
-
미해결TensorFlow 2.0으로 배우는 딥러닝 입문
GRU 리셋게이트, 포겟게이트 질문
강의 슬라이드 내 리셋게이트와 포겟게이트의 축약어가 혼재돼 사용되고 있습니다.어느 게이트가 r이고 어느 게이트가 z인지 헷갈립니다.
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
원핫인코딩 질문
5회 기출유형(작업형2)에서 수치형+범주형 활용에서원-핫 인코딩을 실시하실때 범주형 컬럼을 'cols'에 담아 범주형만 실시해야 되는게 아닌가요?선생님 코딩에는 전체 컬럼을 대상으로 원-핫 인코딩을 하는 게 아닌가요?train = pd.get_dummis(train) 가 아닌cols = [범주형 변수들....]train[cols] = pd.get_dummis(train[cols]) 가 맞는 게 아닌가요?
-
미해결[개정판] 딥러닝 컴퓨터 비전 완벽 가이드
maskRCNN dataset class 할당 문제
안녕하세요 선생님외부 데이터를 가지고 교안 코드를 돌려보는 중인데요 데이터를 자꾸 background로 잡아버려서 학습이 불가합니다... 클래스 개수는 하나이고, coco json 파일에 할당도 아주 잘 되었는데 사진과 같이 모듈에서 배경으로 분류를 해 버립니다..ㅠㅠ 이런 경우 어떻게 해결해야 할런지요
-
미해결[개정판] 파이썬 머신러닝 완벽 가이드
8.6 토픽 모델링
선생님! 제가 토픽 모델링 부분 공부중인데 강의자료 8.6 부분을 그대로 돌렸는데 계속해서 'CountVectorizer' object has no attribute 'get_feature_names' 오류가 뜨네요?? 문제가 뭘까요ㅜ
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
캐글 관련 강의 자료
캐글 관련 강의 자료 마지막에 강의해주신 '작업형1예상문제'와'작업형2예상문제'는 어디에서 확인하나요?캐글에서 "Big Data Certification KR' 에서 확인하나요? 어디에서 찾는지 확인을 할 수 었습니다.
-
해결됨실전 인공지능으로 이어지는 딥러닝 개념 잡기
LSTM 모형의 이해
선생님 이해가 잘 안가는 부분이 있습니다 LSTM을 보면 f, i, s~, o 전부 같은 x, h t-1의 데이터를 쓰고 있지만 각각의 다른 가중치를 쓰는 것은 이해를 했습니다그런데 input, forget 게이트에서 얼만큼 잊고, 얼만큼 받아 드린다고 하셨는데 이 부분은 각각 따로 계산이 되는건가요? 1-x가 아니여서 비율의 합이 1이 아닌데 어떤 원리로 이것을 forget gate라고 하는건가요? (아니면 s t-1이 자체가 전의 정보를 담고 있어서 이를 시그모이드로 비례적으로 계산하는건가요...?) 그리고 마지막으로 i,s~ 는 둘다 곱해서 이를 input gate라고 하는건가요? 아니면 i_t만 input gate인가요?(i,s~ 둘다 같은 데이터인데 가중치만 달라서 혼동이 옵니다) *요약하자면 선생님 써주신 공식을 보면 그냥 같은 데이터에 다른 가중치를 계산한건데 어떤 원리로 이게 작동하는지 잘 이해가 가지 않습니다*가능하시면 해당 수식이 해당 모형에서 어떻게 작동하는지 조금 더 알려주시면 감사하겠습니다 :)
-
미해결[개정판] 딥러닝 컴퓨터 비전 완벽 가이드
fasterRCNN 학습 오류
안녕하세요 선생님. 제가 다른 이미지 데이터를 가지고 fasterRCNN을 실습 중인데요, 정말 고생해서 어떻게 데이터 셋은 만들 거 같은데 학습이 돌아가지 않네요- mmdet - INFO - Automatic scaling of learning rate (LR) has been disabled.이런 에러가 뜹니다.뭐가 문젠지 1도 모르겠고, 설정 파일이나 데이터셋 형식이나 너무 복잡하고 어렵네요ㅠㅠhttps://drive.google.com/file/d/1P3nfyaeWCBdGj29KYL_J0u2_ygGeuPdf/view?usp=sharing부디 검토부탁드립니다. 감사합니다.
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
첨부자료 관련
"4회 기출유형(작업형1) " 에서 첨부 데이터 (basic1.csv 등)는 어디에서 찾아서 작업을 해야 하나요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
에러 확인 부탁드립니다.
1번 문제를 시험환경에서 아래와 같이 코딩하고 실행했는데 아래와 같은 에러가 나타납니다.코랩에서는 잘 실행되던게 시험환경에서만 에러가 납니다. 무엇을 잘 못 한 건가요?a = a[:int(len(a)*0.5)] cond = a['target'] == 0 a = a[cond] print(int(a['proline'].mean()))[에러 내용]
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
섹션 4 - 기출문제 유형파악2021 - 스페셜 게임 - 예시문제 작업형2
학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요먼저 유사한 질문이 있었는지 검색해보세요안녕하세요.아래 링크에 문제 풀이 작성 해봤습니다.피드백 주시면 감사하겠습니다! 섹션 4 - 기출문제 유형파악2021 - 스페셜 게임 - 예시문제 작업형2https://colab.research.google.com/drive/1M2_HMpVPDFk8IheSEDd34Z5sgxheVCI1#scrollTo=eFsvM0T51nzg
-
미해결[개정판] 파이썬 머신러닝 완벽 가이드
xgboost/ light gbm 재학습 질문
- 학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요! - 먼저 유사한 질문이 있었는지 검색해보세요. - 강의 내용을 질문할 경우 몇분 몇초의 내용에 대한 것인지 반드시 기재 부탁드립니다. - 서로 예의를 지키며 존중하는 문화를 만들어가요. - 잠깐! 인프런 서비스 운영 관련 문의는 1:1 문의하기를 이용해주세요. 선생님 안녕하세요. 수업을 듣다 질문이 있어 글을 남깁니다 ㅠㅠ XGboost 실습을 할 때는,xgb_wrapper.fit(X_train, y_train, verbose=True)xgb_wrapper.fit(X_tr, y_tr, early_stopping_rounds=50, eval_metric="logloss",eval_set=evals, verbose=True)이렇게 재학습 시킬 때, X_tr, y_tr을 사용했는데lightgbm 실습을 할때는X_train, y_train으로 테스트 시키는 부분이 없어서 궁금합니다.. light gbm 실습 코드 ))X_train, X_test, y_train, y_test=train_test_split(X_features, y_label,test_size=0.2, random_state=156 )X_tr, X_val, y_tr, y_val= train_test_split(X_train, y_train,test_size=0.1, random_state=156 )lgbm_wrapper = LGBMClassifier(n_estimators=400, learning_rate=0.05) evals = [(X_tr, y_tr), (X_val, y_val)]lgbm_wrapper.fit(X_tr, y_tr, early_stopping_rounds=50, eval_metric="logloss",eval_set=evals, verbose=True)
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
섹션 3 : "머신러닝"과 줄다리기
안녕하세요.빅데이터 분석기사 교재 보다가 비전공자라 그런지 조금 어려워서 인강까지 흘러오게 되었네요. 앞으로 잘 부탁드립니다 : ) 섹션 3 : "머신러닝"과 줄다리기 > 모델링 및 평가(분류) 문제 1번을 아래 링크와 같이 풀어보았습니다.혹시 이런식으로 푸는게 맞는건지 봐주실 수 있을까요?https://colab.research.google.com/drive/17FKBC1yxD5yHil49ubGXElCm2Tq40kDs#scrollTo=n8EH3M_AgD4k
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
평가지표 기준 관련
안녕하세요? 선생님!작업형 2에서 검증데이터를 분리해서 문제에서 제시한 평가지표로 평가를 수행한 후 어느 정도 점수가 나온 경우에 테스트 데이터로 예측을 하여 답안을 제출하는 것으로 알고 있습니다.점수가 좋지 않은 경우 전처리, 피쳐엔지니어링, 하이퍼파라미터 튜닝 등의 과정을 거쳐서 일정 점수 이상이 나오는지 확인을 한후 테스트 데이터 예측을 하는 것으로 알고 있습니다.그런데, 궁금한 점이 각 평가지표 별로 어느정도 점수 이상이거나 이하로 나와야 답안 제출을 할 수 있는지요? 평가지표별로 어느정도 기준 점수가 있는지요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
작업형 2번 문제 유형관련 질문
안녕하세요!덕분에 공부 잘 하고 있습니다!다름이 아니라 작업형 2번 문제에 지도학습 중 분류와 회귀 위주로 기출이 나오고 강의를 해주시는데, 비지도 학습의 군집분석이나 연관분석 문제는 배제하고 공부를 해도 될런지요?만약 공부를 해야 한다면 어디를 참조하여 공부를 하면 될까요? (예시문제 등)
-
미해결비전공자를 위한 진짜 입문 올인원 개발 부트캠프
질문있어요.
setting.jason이 그냥 비어있던데 강사님처럼 똑같이 타이핑 후 3줄을 적어야하나요? 아니면 3줄만 입력하면 되나요?강사님처럼 똑같이 입력해야한다면, 3줄 중 마지막 한줄이 중복되는데 어떻게 하나요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
문제3 변환 관련 문의
# your code #데이터 변환은 replace!! import pandas as pd df = pd.read_csv('members.csv') df = df.dropna(subset=['views']) df['f3'] = df['f3'].fillna(0) df = df.replace('silver',1).replace('gold',2).replace('vip',3) df.head(10)위 처럼 numpy를 불러오지 않고, f3컬럼에 결측값을 0으로 먼저 채운 후 변환문을 사용했는데 결과와 데이터프레임이 같아서혹시 이 방법으로 해도 상관 없는건지 여쭤보려고 합니다~ 다시 확인좀 하려고 지웠다가 다시 문의합니다!그리고 map사용 시 #map import pandas as pd df = pd.read_csv("members.csv") df = df.dropna(subset=['views']) dict_list = {np.nan:0, 'silver':1, 'gold':2, 'vip':3} df['f3'] = df['f3'].map(dict_list) print(df['f3'].sum())numpy를 불러야하는것이 맞겠죠?.. 위에서 이미 한번 numpy 불러와서 에러가 발생하지 않은 것 같아서요.
-
미해결실전 데이터 사이언스 Part 3. 머신러닝의 이해
모델 학습시 랜덤 시드값
강의를 따라가는중 질문이 있습니다.선형 분류모델과, 회귀모델 모두 동일한 내용입니다만.모델을 생성하고, model.fit을통해 학습시킬때,입력 X값과 Y값의 형태가 변하지 않았고, 대상 모델도 같으나모델 학습을 돌릴때 마다 score및 coef_ 및 intercept_ 값이 바뀝니다.train_test_split 할때 seed값을 random_state= 파라미터로 준 것 처럼,모델 학습시마다 랜덤 시드값을 고정할 수 있는지 궁금합니다.