묻고 답해요
158만명의 커뮤니티!! 함께 토론해봐요.
인프런 TOP Writers
-
미해결R로 배우는 통계
강의자료 다운로드 방법
기존 Q&A 링크 및 학습 창에서는 실습용 데이터(성적 자료)가 확인이 안되는데, 어디서 다운로드가 가능할까요?
-
미해결[개정판] 파이썬 머신러닝 완벽 가이드
6번 강의에 사이킷런, 파이썬, 아나콘다 각각 버전 일치 안 시키고 진행해도 강의 따라가 지나요?
6번 강의에 패키지, 파이썬, 아나콘다 버전 강의와 일치 안 시키고 진행해도 되나요? 하다가 버전 때문에 안되면 어떡하나요?
-
미해결[개정판] 파이썬 머신러닝 완벽 가이드
분류 평가 정확도 예측
강사님 안녕하세요! 분류 평가 오차행렬 관련해서 궁금한 점이 있습니다.3.1 정확도 주피터노트북의 Confusion Matrix 코드에서 MNIS 데이터에 대해 오차행렬 평가를 하는데, 이때는 FP, TP가 나오지 않는 이유가 classifier가 dummy classifier로 더 정확한 분류를 하지 못했기 때문이 맞을까요?
-
미해결빅데이터분석기사 필기 올인원: 3주에 끝내는 완벽 대비
기출 풀이 강의
학습을 늦게 시작하여 오늘에서야 1회독을 거의 마쳐가는데 섹션 49 50의 최신기출변형 외에 기출문제 강의가 또 있을까요?
-
미해결빅데이터분석기사 필기 올인원: 3주에 끝내는 완벽 대비
서포트벡터머신에서 회귀 예측 방식
안녕하세요~!강의 내용을 통해서 서포트벡터머신을 활용한 분류를 수행하는 방식은 이해가 가는데, 연속형 값을 예측하는 방식은 어떤 개념으로 수행되는 것인지 궁금합니다.
-
미해결엑셀로 배우는 기초통계
32강 동영상 안됩니다 2달전 QA의 문제가 아직도 해결 안되었네요
- 학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요! - 먼저 유사한 질문이 있었는지 검색해보세요. - 서로 예의를 지키며 존중하는 문화를 만들어가요. - 잠깐! 인프런 서비스 운영 관련 문의는 1:1 문의하기를 이용해주세요.
-
미해결빅데이터분석기사 필기 올인원: 3주에 끝내는 완벽 대비
안녕하세요 질문있습니다
강의 열심히 잘 듣고있는데요 교재 ppt 만 잘 공부해도 필기 합격가능할까요 아니면 추가로 기본서 하나 사서 보는게 좋을까요...
-
미해결빅데이터분석기사 필기 올인원: 3주에 끝내는 완벽 대비
데이터분할 - K-Fold 교차 검증 질문
K개 Fold를 지정해서, K-1개의 Fold로 모델을 학습하고, 1개의 Fold로 테스트를 진행이것을 K번 반복한 결과를 평가 결과로 사용Q)각 단계별로 학습 데이터가 달라져 새로운 모델 함수가 만들어 지는데, 최종적으로 어떤 모델을 선정해야 하는 걸까요?제가 잘못 이해하고 있는지 문의드립니다!
-
해결됨[개정판] 파이썬 머신러닝 완벽 가이드
안녕하세요. 강의 들으면서 업무에 적용하고 싶은 수강생입니다.
강사님의 강의들을 잘듣고 있습니다.정말 실무에 도움이 될까하고 듣고있는데 아직 다듣지는 못하고 있지만 도움이 될것 같습니다.하지만 실무에서 접하는 내용은 또 강의와 깊이가 다를수 있기에 이렇게 실례를 무릅쓰고 문의 드립니다. 제가 있었던 기업에서 전에 쓰던 기법이였는데 그때는 그냥 그렇게 넘어갔지만 강사님의 강의를 듣고 그때 그런 것이 맞았나 복기하고 공부하고 싶어서 질문드립니다. 먼저대략은 머신러닝 알고리즘을 두개를 돌리는데하나는 기초 속성을 가지고 lightgbm으로 분류 작업 (1,0) 속성으로 예측을 합니다. 그리고 그 결과중 y_proba를 가지고 k-means 군집화를 하여 군집 클러스트링을 만들려고 합니다. 0) 여러 학습을 할 속성을 전처리해서 가지고 옵니다. 속성을 많은데 뒤에 예측을 하는 20개의 결과 값을 속성과 함께 자지고 온뒤 나중에원본값은 대략 저렇고속성 1----- 속성30 , y_test 1, ... y_test 20... 나중에 y_test 1 부터 y_test20 까지 20개의 예측을 하려고 모델을 만듧니다. 1) LightGBM 으로 분류작업을 합니다. (for 문을 돌아 20개의 예측 즉 모델을 만듭니다.) x_tr1 속성1 속성2 속성3 ...... 속성30 y_test1 0 1 1 ..... 0. 1 . . . x_tr15 속성1 속성2 속성3 ...... 속성30. y_test20 1 0 1 ..... 1 . . .2) Y_test1. y_pred1 y_proba1 0 1 0.91 1 1 0.43 1 1 0.73 0 1 0.80 . . . Y_test15. y_pred20 y_proba20 0 1 0.34 1 1 0.35 1 1 0.73 0 1 0.91 . . . 3) 군집화(k-means) 를 위한 데이터를 만듭니다.Y_proba1. ......... Y_proba20 0.91 .... 0.34 0.43. .... 0.35 0.73 .... 0.73 0.80 .... 0.91 4) 제가 재기하는 문제는 다음입니다.군집화를 위한 데이터를 분류의 결과값중 하나인 y_proba를 써도 되는 건지?왜냐하면 y_proba는 그 맞는지에 대한 확률 값이 아니고 그 값을 예측하기 위한 신뢰도 아닐까요?(예전 현업들은 그 값(y_proba)들을 최종 확률 [즉 맞는 확률 예를 든다면, 암에 걸릴 최종 확률] 로 알고 있더군요.)즉 1 = 예측 0 = 정답 y_proba = 0.9 라는 의미는 0.9의 신뢰혹은 확신으로 예측을 했으니 결과로 틀렸다. 라는 개념인데이것을 마치 (암에 걸릴 확율이 90% 야)의미 있는 값의 나열로 보고 군집을 하려는게 과연 의미있는 결과로 군집이 될지 의문입니다.저희가 붓꼿꽂데이터로 클러스트링으로 군집을 하지만 그 속성들로는 너비같은 관련이 있는 속성을 쓰잖아요.하지만 제가 보내드린 예는 속성이 0.91이라는게 예측이 틀리건 맞건 그냥 그 예측을 위한 신뢰확률성인데 말이죠. 즉 군집화를 위한 기초 값들이y_proba1. y_proba2 .... y_proba 200.91 0.43 0.80...y_proba1. y_proba2 .... y_proba 200.32 0.62 0.65 있다면의 값의 의미는 예를 들어 하나의 로의 하나의 로 의 의미가 0.91 이라 한다면 이건 앞서 lightgbm 예측이 틀린 경우와 맞는 경우를 구분할수 없는 숫자들의 나열 아닌가요? 물론 열로 쭉 늘어 놓은 패턴으로서의 군집을 하려는 의미는 있을지는 모르겠으나... 전문가의 선생님의 의견을 꼭 듣고 싶네요.주말에 이렇게 질문드려서 죄송해요. 그냥 열정이라고 생각해 주시면 좋겠어요, 더운데 몸 조심하세요.
-
미해결[개정판] 파이썬 머신러닝 완벽 가이드
카카오톡 채널 있나요
하다가 막히면 먼저 선행한 사람들 한테 해결법 들을 수 있는 카카오톡 채널 같은데 있을까요?
-
미해결빅데이터분석기사 필기 올인원: 3주에 끝내는 완벽 대비
F검정 질문있습니다
BDA0607 기출변형문제 6분대 보시면F검정을 하십니다.귀무가설에서 분산이 같다고 설정했고,F0=(s1^2/s2^2)/ (σ1^2/σ2^2)=(s1^2/s2^2) 으로 풀지 않나요?품질경영기사 취득할때 F검정 공식을 이렇게 배웠던거 같아서요. 그럼 F0=(10^2/50^2)=0.04가 나와 헷갈려서 질문남깁니다
-
미해결[개정판] 파이썬 머신러닝 완벽 가이드
혹시 강의에서 사용하시는 ppt 받을 수 있는건가요
- 학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요! - 먼저 유사한 질문이 있었는지 검색해보세요. - 강의 내용을 질문할 경우 몇분 몇초의 내용에 대한 것인지 반드시 기재 부탁드립니다. - 서로 예의를 지키며 존중하는 문화를 만들어가요. - 잠깐! 인프런 서비스 운영 관련 문의는 1:1 문의하기를 이용해주세요. 혹시 강의에서 사용하시는 ppt 받을 수 있는건가요
-
미해결빅데이터분석기사 필기 올인원: 3주에 끝내는 완벽 대비
포트폴리오 사분면 과제 우선순위
적용 우선순위 기준이 시급성일 때 3 > 4 > 2적용 우선순위 기준이 난이도일 때 3 > 1 > 2라고 설명해주셨는데,'시급성'이 기준이라면, 현재가 우선이고 난이도가 쉬운것부터 다루니 3 > 1 > 2 아닌가요?'난이도' 기준도 동일하게, 난이도가 쉬운것이 우선이고 현재와 미래 중 현재가 우선이니 3 > 4 > 2 일 것 같은데머리로 그냥 생각하면 설명해주신 자료와 내용이 부합하지 않는 것 같아서 질문드립니다.
-
미해결[개정판] 파이썬 머신러닝 완벽 가이드
pca 스케일링 관련하여 질문드립니다.
안녕하세요 강사님! 덕분에 머신러닝 강의를 재밌게 수강중입니다.다름이 아니라 이번 강의에서 pca이전 standard scaler를 적용하여야 한다고 하셨는데혹시 standard scaler 대신 min-max scaler를 사용하면 안되는 걸까요?
-
미해결[개정판] 파이썬 머신러닝 완벽 가이드
주피터 대신 구글 코랩
안녕하세요 이제 막 아나콘다 설치를 하려고 하는데 이상하게 설치가 되어도 실행이 안되고 아예 앱에서 검색을 해봐도 anaconda가 나오지 않고 있네용...ㅠ 분명 성공적으로 설치가 되었다고 페이디까지 나왔는데ㅜ 지금 5번째 재설치인데 안되면 구글 코랩으로 대신하여도 괜찮을까요??? 결과 값이 다를 수 있다는 점은 이미 인지하고 있습니다.
-
미해결[개정판] 파이썬 머신러닝 완벽 가이드
강의에서 사용하는 pdf or ppt자료는 따로 없는 건가요?
강의에서 사용하는 pdf or ppt자료는 따로 없는 건가요?
-
해결됨빅데이터분석기사 필기 올인원: 3주에 끝내는 완벽 대비
데이터곤련 직무 기출변형문제 질문
데이터 관련 직무 문제에서관계형 데이터베이스 구조를 하둡 플랫폼으로 바꾸고, 그 상태를 지속적으로 모니터링한다 --> 데이터엔지니어가 정답인 듯 한데, 데이터 아키텍트의 경우도 유사한 업무를 수행 가능한게 아닌지요?
-
미해결AB 테스트 실무자 완벽 가이드
최소 샘플 사이즈
안녕하세요 좋은 강의 감사드립니다. 3강 ppt 마지막 페이지의 최소 샘플 수 공식 관련 질문 있습니다. 마지막 줄에 샘플 수 구하는 공식이 n=(첫번째 항)^2(두번째 항)^2/(분모) 라고 적혀있는데, 혹시 n=(첫번째 항)^2(두번째 항)/(분모) 이 아닌가요?즉, 분자의 두번째 괄호에 제곱을 적용하지 않는 것이 맞는지 질문드립니다. 왜냐하면 해당 페이지 좌측 파이썬 코드에서도 두 번째 괄호에서 제곱이 빠져있으며, 실제로 5강과 6강의 예제 실험에서도 제곱을 빼고 계산해야 적어주신 샘플수가 계산 되더라구요.. ▶5강: ( (0.84+1.96)**2 (0.3*(1-0.3)+0.306*(1-0.306)) ) / ((0.306-0.3)**2) = 91981.49▶ 6강: ( (0.84+1.96)**2 (0.2*(1-0.2)+0.208*(1-0.208)) ) / ((0.208-0.2)*2) = 39780.16 따라서 강사님께 확인차 여쭙고자 합니다. 감사합니다.
-
미해결[개정판] 파이썬 머신러닝 완벽 가이드
실루엣 스코어..
안녕하세요 선생님! 질문이 있습니다. 저는 Graph attention Network (Layer 3개)를 통과할 때마다 얻어지는 attention map을 저장해놓고, (npy)이를 clustering하고 있는데요,attention map을 flatten한 뒤 KMeans를 활용하고 있습니다. 이때실루엣 스코어가 k를 늘려나감에 따라서 계속 올라간다면, 이상한 현상이라고 봐야할까요??이때 저는 cluster label은 가지고 있지 않아요. Davis bouldin이나 Calinski harabasz도 같이 보고 있는데, 그리고 elbow method로도요,, 그런데 이상하게 실루엣 스코어 결과 k를 50에 가깝게 내놓게 되고 실제로 plot을 그려보면 saturation을 하지 않고 계속 k가 늘어남에 따라서 실루엣 스코어가 늘어난다면 이상한 현상이라고 봐야할까요?? 감사합니다.
-
해결됨[개정판] 파이썬 머신러닝 완벽 가이드
float64 null 값 처리 방법
코랩에서 house_df.fillna(house_df.mean(), inplace=True)를 실행하였는데 에러가 나서 커뮤니티를 보니# object가 아닌 number 타입을 별도 리스트로 추출 num_columns=house_df.dtypes[house_df.dtypes!='object'].index.to_list() # Drop 하지 않는 number 타입 컬럼들에 대해서 Null컬럼들은 평균값으로 대체 house_df[num_columns].fillna(house_df[num_columns].mean(),inplace=True)이렇게 코드를 변경하여 실행해보라고 하여 실행하였습니다.그런데, # Null 값이 있는 피처명과 타입을 추출 null_column_count = house_df.isnull().sum()[house_df.isnull().sum() > 0] print('## Null 피처의 Type :\n', house_df.dtypes[null_column_count.index])이 코드를 실행하니 Null 피처의 Type 중에서 float64 컬럼들은 null값이 제대로 처리가 안된 걸 알 수 있었습니다. 어떻게 해결할 수 있을까요?