묻고 답해요
158만명의 커뮤니티!! 함께 토론해봐요.
인프런 TOP Writers
-
미해결엑셀로 배우는 기초통계
"32. 모평균의 추정 엑셀 실습" 동영상 오류
32. 모평균의 추정 엑셀 실습 강의를 수강하려고 하는데, 재생이 안됩니다. 확인부탁드립니다.
-
해결됨통계 분석 마스터 클래스
데이터 크롤링-웹에서 가져오기가 안되요
예제로 주신 주소 그대로 복사해서 웹에서 가져오기를 하려고 하는데 이렇게 나옵니다.그리고 어떤 걸 선택해도 테이블 형태의 값을 가져오지 못하네요달러매출, 멜론 url은 잘 나오는데, 프로야구 예제가 다 제대로 안나와서 문의드립니다.
-
미해결[개정판] 파이썬 머신러닝 완벽 가이드
TMDB5000 데이터 세트를 이용한 콘텐츠기반 필터링 구현 실습 - 02 강의내용 질문입니다
안녕하세요168. TMDB5000 데이터 세트를 이용한 콘텐츠기반 필터링 구현 실습 - 02강의에서9:50 부분을 보면find_sim_movie() 함수가 있습니다강의 동영상에서는 The Godfather 와 유사도가 높은 순으로 결과가 나왔는데The Godfather 가 유사도가 가장 높아야 되는데The Godfatehr 가 아니고 다른 영화가유사도가 가장 높은 것으로 나옵니다왜 이런 결과가 나오는지 설명 부탁드립니다
-
미해결[개정판] 파이썬 머신러닝 완벽 가이드
라소,릿지 gridsearchcv에서 알파값관련
알파값을 릿지는 0.05,0.1,1,5,8,10,12,15,20라소는 0.001,0.005------ 이렇게 잡는 이유와 기준이 무엇인지?그냥 경험치인건지
-
미해결[개정판] 파이썬 머신러닝 완벽 가이드
사이킷런을 이용한 GMM 군집화 실습 강의 중 질문입니다.
안녕하세요사이킷런을 이용한 GMM 군집화 실습 강의 중 질문입니다.9:15 에서transformation = [[0.60834549,-0.63667341],[-0.40887717,0.85253229]]로 설정하면 된다고 하셨는데이 값들은 어디서 도출된 값인가요?이 부분은 자세한 설명 없이 바로 다음 부분으로 넘어가시는데요,이 값들이 어떻게 도출된 값들인지자세한 설명 부탁드립니다
-
해결됨빅데이터분석기사 필기 올인원: 3주에 끝내는 완벽 대비
실기 강의 알려 주세요 ?
사전 점수 확인 합격입니다. 실기 강의 Masocampus 강의 들으면 되나요 ? 알려 주세요...
-
미해결[개정판] 파이썬 머신러닝 완벽 가이드
XGBoost early stopping
수업 중 다룬, 책에도 있는 코드가 실행시 오류 나는 데, 해결이 쉽지 않습니다.(원본 미변경) 사진에서는 잘렸는데, early stopping이 wrapper_fit에서 적용 불가해서 오류가 발생합니다.실행해본 해결법xgboost 라이브러리 다운그레이드시(사용하셨던 1.5등), 넘파이 판다스 추가 다운그레이드로 라이브러리간 충돌이 일어납니다. 참고 - 로컬에서도 마찬가지 방식으로 오류가 발생합니다.xgboost 라이브러리 현재 버전은 3.0입니다.동일한 내용을 실습 가능한 대체 코드 공유해 주시면 감사하겠습니다 🙂
-
미해결[개정판] 파이썬 머신러닝 완벽 가이드
강의관련 질문
안녕하세요.강의내용과 다 좋아서 여쭤보고 싶어서 그러는데 이번에 제가 들어갈 프로젝트가 4개 gpu 서버를 분할해서 머신러닝 아키텍처를 만들어야하는데 혹시 선생님 강의중에 들을만한 강의가 있을까요??
-
미해결[개정판] 파이썬 머신러닝 완벽 가이드
협업 필터링 방식에 대한 질문이 있습니다.
안녕하세요. 강의 정말 잘 듣고 있습니다.다름이 아니라, 협업 필터링 방식을 설명하실 때 사용자-아이템 평점 매트릭스와 같은 축적된 '사용자 행동 데이터'를 기반으로 예측 평가한다고 하셨습니다.여기서 궁금한 점은 '사용자 행동 데이터'가 꼭 사용자-아이템 평점 매트릭스여야 하는지 입니다.굳이 사용자-아이템 평점이 아니여도 사용자의 행동을 나타내는 데이터면 가능한가요?
-
해결됨[개정판] 파이썬 머신러닝 완벽 가이드
precision_recall_curve 와 관련해서 질문있습니다.
안녕하세요! 제가 계속하는데 shape 자체가 달라서 질문 남깁니다.. 강의에서는 반환된 thresholds나 나머지 것들이 147, 148개의 자료들이 생성되는데, 저는 코딩을 다시해봐도 165개, 166개가 나오더라구요.. 제가 어떤 부분에서 놓쳤는지 잘 몰라 질문드립니다.
-
해결됨빅데이터분석기사 필기 올인원: 3주에 끝내는 완벽 대비
가설검정 - 평균검정 예제문제
한 음료 회사는 자사의 콜라 병이 평균적으로 500ml를 담고 있다고 주장한다. 하지만 소비자들은 병에 담긴 콜라의 양이 평균보다 적다고 생각한다. 이를 검증하기 위해 30병(n)의 콜라를 무작위로 선택하여 용량을 측정했다. 측정 결과, 플의 평균 용량은 495ml(x바)였고, 표준편차는 10ml(s)였다. 유의 수준을 0.05로 설정할 때, 콜라의 양이 평균보다 적은지 검정해보자.• 전체 관측치 수 : 30개• 귀무가설(H₀) : mu = 500• 대립가설(H₁) : mu < 500 • 유의 수준 0.05에서, 자유도가 29인 t 분포의 한쪽 꼬리(왼쪽)의 임계값은 -1.699 • 계산된 t-값(-2.74)이 임계값(-1.699)보다 작으므로 유의 수준 0.05에서 귀무 가설을 기각 여기서 임계값은 t분표표에서 찾는 것인가요? 찾는다면 어떤 방식으로 찾는 방법이 있는지 문의 드립니다.
-
미해결[개정판] 파이썬 머신러닝 완벽 가이드
문자열 포맷팅
- 학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요! - 먼저 유사한 질문이 있었는지 검색해보세요. - 강의 내용을 질문할 경우 몇분 몇초의 내용에 대한 것인지 반드시 기재 부탁드립니다. - 서로 예의를 지키며 존중하는 문화를 만들어가요. - 잠깐! 인프런 서비스 운영 관련 문의는 1:1 문의하기를 이용해주세요.세번째 cell에서 print('array1: {:0}차원, array2: {:1}차원, array3: {:2}차원'.format(array1.ndim,array2.ndim,array3.ndim)){:0} {:1} {:2} 이것들이 의미하는게 궁금합니다
-
해결됨[개정판] 파이썬 머신러닝 완벽 가이드
자문자답) 수강 시작 전에 아나콘다 버전을 강의와 맞추면 즐강
안녕하세요 선생님.선생님의 강의 덕분에 많은 것들을 배웁니다. 감사합니다. 많은 사람들이 강의 수강에 앞서 프로그램 환경설정에서 공통된 질문이 많은데, 선생님께서 계속 같은 질문에 답변을 반복하시는 모습에.. 다음 분들을 위해 가이드로 공유하고자 합니다. 참고로 버전이 업그레이드되면 API는 수시로 바뀝니다. 사용 방식이 조금씩 바뀌거나, 아예 달라지기도 합니다. 부디 해당 강의와 같은 버전으로 진행하시길 강력히 권장합니다. 현시점 아나콘다 공식 홈페이지의 다운로드 링크는 최신 버전만 다운로드할 수 있게 웹 브라우저를 보여줍니다. 따라서 아나콘다 공식 아카이브로 접근하여 원하는 버전을 다운로드합니다.아나콘다 아카이브 저장소 접근(link)아나콘다 아카이브에 접근하면 원하는 버전의 아나콘다를 다운로드 받을 수 있습니다. 여기서 주의해야 할 사항은 Python 3.9 기반의 아나콘다를 다운로드 받으셔야 합니다. 2022년도 아나콘다 쓰세요. 2023년도 아나콘다부터는 Python 3.10이더군요. Python 3.9을 기반으로 하는 2022년 아나콘다 다운로드2022년도 5월과 10월 버전이 있는데, 이 둘의 차이는 아나콘다 release 노트에서 확인할 수 있습니다. 참고로 많은 분들이 남기신 scikit-learn 버전도 2022.05 아나콘다부터 1.0.2가 기본 버전입니다. 2022년도 아나콘다로 진행하시면 lightgbm이고 뭐고 다 강의와 동일하게 진행하실 수 있습니다.아나콘다 버전만 잘 설치하시면, 나머지는 강의 따라가면 됩니다. 즐강하십쇼.p.s. 이미 아나콘다 최신 버전을 설치해 버리셨다면.. 다시 설치하시길 바랍니다. 윈도우 기준, C:\Users\{user}\anaconda3 경로에 Uninstall-Anaconda3.exe라는 파일을 실행시켜 지울 수 있습니다....
-
해결됨AB 테스트 실무자 완벽 가이드
후속모니터링에 대해 질문드립니다.
안녕하세요!좋은강의 감사드립니다. 후속모니터링 부분에 대해 질문이 있어 남깁니다. 후속모니터링이 필요한 이유에 대해서는 이해하였는데요. 후속모니터링의 기간은 어느정도로 해야할까요? 보편적인 기준이나 기간을 구하는 방법이 있을까요?
-
미해결[개정판] 파이썬 머신러닝 완벽 가이드
갑자기 데이터 프레임이 되는 이유
기존 14:20초 부근에서titanic_df['Pclass'].value_counts().reset_index()를 실행했을때 출력되는 모양(그냥 텍스트 형태)로 나오는 것과15:18 부근 코드는 같은데 테이블 형태로 나오는 것의 차이는 무엇인가요?
-
미해결확률과 통계 기초
8.2, 8.3 강의 독립성
- 학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요! - 먼저 유사한 질문이 있었는지 검색해보세요. - 서로 예의를 지키며 존중하는 문화를 만들어가요. - 잠깐! 인프런 서비스 운영 관련 문의는 1:1 문의하기를 이용해주세요. 안녕하세요ch.8-2 14p에 Y1 Y2 가 xi 와 x_bar가 엮여있는데 어떻게 iid인지 증명할 수 있는 방법과 ch8.3 23p 카이제곱분포에서 x_bar와 S^2 이 독립이라 하셨는데 그냥 서로 다른 정규분포, 카이제곱 분포라 그런건가요? 이해가 잘 안가는데 증명과정 알려주시면 감사하겠습니다.
-
미해결[개정판] 파이썬 머신러닝 완벽 가이드
인덱싱 차원 축소 관련
- 학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요! - 먼저 유사한 질문이 있었는지 검색해보세요. - 강의 내용을 질문할 경우 몇분 몇초의 내용에 대한 것인지 반드시 기재 부탁드립니다. - 서로 예의를 지키며 존중하는 문화를 만들어가요. - 잠깐! 인프런 서비스 운영 관련 문의는 1:1 문의하기를 이용해주세요. array1d = np.arange(start=1, stop=10)array2d = array1d.reshape(3,3)print(array2d)array3 = array2d[[0,1], 2]이것의 답이 [3, 6] 이 되는데,만약 답을 [[3], [6]] 을 만들고 싶으면 인덱싱ㅇ르 어떻게 해야 하나요?
-
미해결[개정판] 파이썬 머신러닝 완벽 가이드
opt() 오류 질문 있습니다.
안녕하세요, 선생님 항상고생많으십니다.다름이 아니라, konlpy 설치 순서를 그대로 따라하고 * JAVA-HOME 시스템설정 변수 변경 포함 ), java version 도 선생님이 설치하신 것과 동일하게 맞추었는데 다음의 코드에서 해당 오류가 발생합니다.from konlpy.tag import Okt okt = Okt() def tw_tokenizer(text): # 입력 인자로 들어온 text 를 형태소 단어로 토큰화 하여 list 객체 반환 tokens_ko = okt.morphs(text) return tokens_ko tw_tokenizer('아버지가방에 들어가신다') 제가 놓친게 있을까요?
-
미해결[개정판] 파이썬 머신러닝 완벽 가이드
정확도 검증이 끝난 후에 모델 적용하여 분류하는 다음과정에 대한 질문
- 학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요! - 먼저 유사한 질문이 있었는지 검색해보세요. - 강의 내용을 질문할 경우 몇분 몇초의 내용에 대한 것인지 반드시 기재 부탁드립니다. - 서로 예의를 지키며 존중하는 문화를 만들어가요. - 잠깐! 인프런 서비스 운영 관련 문의는 1:1 문의하기를 이용해주세요. 안녕하세요. 강사님.텍스트 또는 문장의 벡터화 -> 벡터화된 데이터셋을 Train/Test로 나눔 -> 회귀 또는 분류모델을 훈련 및 검증-> best pram(gridsearchCV)를 통해서 보다 정확도를 높임 - > ??? 이 이후에 과정에서 궁금합니다.훈련과 검증이 완료된 모델을 저장하고 이를 메서드화(def) 한 이후 텍스트 분류라면 분류하고자 하는 DF의 컬럼을 apply lambda로 해서분류를 하는 파생컬럼을 만든 다던지 그렇게 진행하는 것인가요?
-
미해결[개정판] 파이썬 머신러닝 완벽 가이드
XGboost 2.1.3 최신버전 사이킷런 XGboost
불가피하게 최신버전 사용하시는 분들 참고하시라고 글 남깁니다.(for 코랩)XGBoost 2.1.3 기준으로 early_stopping_rounds=50, eval_metric="logloss"을 XBGclassifier의 매개변수로 넣는걸로 바뀐 것 같습니다. from xgboost import XGBClassifier xgb_wrapper = XGBClassifier(n_estimators=400, learning_rate=0.05, max_depth=3, early_stopping_rounds=50, eval_metric="logloss") evals = [(X_tr, y_tr), (X_val, y_val)] xgb_wrapper.fit(X_tr, y_tr,eval_set=evals, verbose=True) ws50_preds = xgb_wrapper.predict(X_test) ws50_pred_proba = xgb_wrapper.predict_proba(X_test)[:, 1].이런걸 찾는과정을 중요하게 생각하시면 내리셔도 괜찮습니다.참고자료: https://stackoverflow.com/questions/78713048/xgbclassifier-fit-got-an-unexpected-keyword-argument-early-stopping-rounds