묻고 답해요
160만명의 커뮤니티!! 함께 토론해봐요.
인프런 TOP Writers
-
미해결빅데이터분석기사 필기 올인원: 3주에 끝내는 완벽 대비
포트폴리오 사분면 과제 우선순위
적용 우선순위 기준이 시급성일 때 3 > 4 > 2적용 우선순위 기준이 난이도일 때 3 > 1 > 2라고 설명해주셨는데,'시급성'이 기준이라면, 현재가 우선이고 난이도가 쉬운것부터 다루니 3 > 1 > 2 아닌가요?'난이도' 기준도 동일하게, 난이도가 쉬운것이 우선이고 현재와 미래 중 현재가 우선이니 3 > 4 > 2 일 것 같은데머리로 그냥 생각하면 설명해주신 자료와 내용이 부합하지 않는 것 같아서 질문드립니다.
-
미해결[개정판] 파이썬 머신러닝 완벽 가이드
pca 스케일링 관련하여 질문드립니다.
안녕하세요 강사님! 덕분에 머신러닝 강의를 재밌게 수강중입니다.다름이 아니라 이번 강의에서 pca이전 standard scaler를 적용하여야 한다고 하셨는데혹시 standard scaler 대신 min-max scaler를 사용하면 안되는 걸까요?
-
미해결[개정판] 파이썬 머신러닝 완벽 가이드
주피터 대신 구글 코랩
안녕하세요 이제 막 아나콘다 설치를 하려고 하는데 이상하게 설치가 되어도 실행이 안되고 아예 앱에서 검색을 해봐도 anaconda가 나오지 않고 있네용...ㅠ 분명 성공적으로 설치가 되었다고 페이디까지 나왔는데ㅜ 지금 5번째 재설치인데 안되면 구글 코랩으로 대신하여도 괜찮을까요??? 결과 값이 다를 수 있다는 점은 이미 인지하고 있습니다.
-
미해결[개정판] 파이썬 머신러닝 완벽 가이드
강의에서 사용하는 pdf or ppt자료는 따로 없는 건가요?
강의에서 사용하는 pdf or ppt자료는 따로 없는 건가요?
-
해결됨빅데이터분석기사 필기 올인원: 3주에 끝내는 완벽 대비
데이터곤련 직무 기출변형문제 질문
데이터 관련 직무 문제에서관계형 데이터베이스 구조를 하둡 플랫폼으로 바꾸고, 그 상태를 지속적으로 모니터링한다 --> 데이터엔지니어가 정답인 듯 한데, 데이터 아키텍트의 경우도 유사한 업무를 수행 가능한게 아닌지요?
-
미해결AB 테스트 실무자 완벽 가이드
최소 샘플 사이즈
안녕하세요 좋은 강의 감사드립니다. 3강 ppt 마지막 페이지의 최소 샘플 수 공식 관련 질문 있습니다. 마지막 줄에 샘플 수 구하는 공식이 n=(첫번째 항)^2(두번째 항)^2/(분모) 라고 적혀있는데, 혹시 n=(첫번째 항)^2(두번째 항)/(분모) 이 아닌가요?즉, 분자의 두번째 괄호에 제곱을 적용하지 않는 것이 맞는지 질문드립니다. 왜냐하면 해당 페이지 좌측 파이썬 코드에서도 두 번째 괄호에서 제곱이 빠져있으며, 실제로 5강과 6강의 예제 실험에서도 제곱을 빼고 계산해야 적어주신 샘플수가 계산 되더라구요.. ▶5강: ( (0.84+1.96)**2 (0.3*(1-0.3)+0.306*(1-0.306)) ) / ((0.306-0.3)**2) = 91981.49▶ 6강: ( (0.84+1.96)**2 (0.2*(1-0.2)+0.208*(1-0.208)) ) / ((0.208-0.2)*2) = 39780.16 따라서 강사님께 확인차 여쭙고자 합니다. 감사합니다.
-
미해결[개정판] 파이썬 머신러닝 완벽 가이드
실루엣 스코어..
안녕하세요 선생님! 질문이 있습니다. 저는 Graph attention Network (Layer 3개)를 통과할 때마다 얻어지는 attention map을 저장해놓고, (npy)이를 clustering하고 있는데요,attention map을 flatten한 뒤 KMeans를 활용하고 있습니다. 이때실루엣 스코어가 k를 늘려나감에 따라서 계속 올라간다면, 이상한 현상이라고 봐야할까요??이때 저는 cluster label은 가지고 있지 않아요. Davis bouldin이나 Calinski harabasz도 같이 보고 있는데, 그리고 elbow method로도요,, 그런데 이상하게 실루엣 스코어 결과 k를 50에 가깝게 내놓게 되고 실제로 plot을 그려보면 saturation을 하지 않고 계속 k가 늘어남에 따라서 실루엣 스코어가 늘어난다면 이상한 현상이라고 봐야할까요?? 감사합니다.
-
해결됨[개정판] 파이썬 머신러닝 완벽 가이드
float64 null 값 처리 방법
코랩에서 house_df.fillna(house_df.mean(), inplace=True)를 실행하였는데 에러가 나서 커뮤니티를 보니# object가 아닌 number 타입을 별도 리스트로 추출 num_columns=house_df.dtypes[house_df.dtypes!='object'].index.to_list() # Drop 하지 않는 number 타입 컬럼들에 대해서 Null컬럼들은 평균값으로 대체 house_df[num_columns].fillna(house_df[num_columns].mean(),inplace=True)이렇게 코드를 변경하여 실행해보라고 하여 실행하였습니다.그런데, # Null 값이 있는 피처명과 타입을 추출 null_column_count = house_df.isnull().sum()[house_df.isnull().sum() > 0] print('## Null 피처의 Type :\n', house_df.dtypes[null_column_count.index])이 코드를 실행하니 Null 피처의 Type 중에서 float64 컬럼들은 null값이 제대로 처리가 안된 걸 알 수 있었습니다. 어떻게 해결할 수 있을까요?
-
미해결엑셀로 배우는 기초통계
"32. 모평균의 추정 엑셀 실습" 동영상 오류
32. 모평균의 추정 엑셀 실습 강의를 수강하려고 하는데, 재생이 안됩니다. 확인부탁드립니다.
-
해결됨통계 분석 마스터 클래스
데이터 크롤링-웹에서 가져오기가 안되요
예제로 주신 주소 그대로 복사해서 웹에서 가져오기를 하려고 하는데 이렇게 나옵니다.그리고 어떤 걸 선택해도 테이블 형태의 값을 가져오지 못하네요달러매출, 멜론 url은 잘 나오는데, 프로야구 예제가 다 제대로 안나와서 문의드립니다.
-
미해결[개정판] 파이썬 머신러닝 완벽 가이드
TMDB5000 데이터 세트를 이용한 콘텐츠기반 필터링 구현 실습 - 02 강의내용 질문입니다
안녕하세요168. TMDB5000 데이터 세트를 이용한 콘텐츠기반 필터링 구현 실습 - 02강의에서9:50 부분을 보면find_sim_movie() 함수가 있습니다강의 동영상에서는 The Godfather 와 유사도가 높은 순으로 결과가 나왔는데The Godfather 가 유사도가 가장 높아야 되는데The Godfatehr 가 아니고 다른 영화가유사도가 가장 높은 것으로 나옵니다왜 이런 결과가 나오는지 설명 부탁드립니다
-
미해결[개정판] 파이썬 머신러닝 완벽 가이드
라소,릿지 gridsearchcv에서 알파값관련
알파값을 릿지는 0.05,0.1,1,5,8,10,12,15,20라소는 0.001,0.005------ 이렇게 잡는 이유와 기준이 무엇인지?그냥 경험치인건지
-
미해결[개정판] 파이썬 머신러닝 완벽 가이드
사이킷런을 이용한 GMM 군집화 실습 강의 중 질문입니다.
안녕하세요사이킷런을 이용한 GMM 군집화 실습 강의 중 질문입니다.9:15 에서transformation = [[0.60834549,-0.63667341],[-0.40887717,0.85253229]]로 설정하면 된다고 하셨는데이 값들은 어디서 도출된 값인가요?이 부분은 자세한 설명 없이 바로 다음 부분으로 넘어가시는데요,이 값들이 어떻게 도출된 값들인지자세한 설명 부탁드립니다
-
해결됨빅데이터분석기사 필기 올인원: 3주에 끝내는 완벽 대비
실기 강의 알려 주세요 ?
사전 점수 확인 합격입니다. 실기 강의 Masocampus 강의 들으면 되나요 ? 알려 주세요...
-
미해결[개정판] 파이썬 머신러닝 완벽 가이드
XGBoost early stopping
수업 중 다룬, 책에도 있는 코드가 실행시 오류 나는 데, 해결이 쉽지 않습니다.(원본 미변경) 사진에서는 잘렸는데, early stopping이 wrapper_fit에서 적용 불가해서 오류가 발생합니다.실행해본 해결법xgboost 라이브러리 다운그레이드시(사용하셨던 1.5등), 넘파이 판다스 추가 다운그레이드로 라이브러리간 충돌이 일어납니다. 참고 - 로컬에서도 마찬가지 방식으로 오류가 발생합니다.xgboost 라이브러리 현재 버전은 3.0입니다.동일한 내용을 실습 가능한 대체 코드 공유해 주시면 감사하겠습니다 🙂
-
미해결[개정판] 파이썬 머신러닝 완벽 가이드
강의관련 질문
안녕하세요.강의내용과 다 좋아서 여쭤보고 싶어서 그러는데 이번에 제가 들어갈 프로젝트가 4개 gpu 서버를 분할해서 머신러닝 아키텍처를 만들어야하는데 혹시 선생님 강의중에 들을만한 강의가 있을까요??
-
미해결[개정판] 파이썬 머신러닝 완벽 가이드
협업 필터링 방식에 대한 질문이 있습니다.
안녕하세요. 강의 정말 잘 듣고 있습니다.다름이 아니라, 협업 필터링 방식을 설명하실 때 사용자-아이템 평점 매트릭스와 같은 축적된 '사용자 행동 데이터'를 기반으로 예측 평가한다고 하셨습니다.여기서 궁금한 점은 '사용자 행동 데이터'가 꼭 사용자-아이템 평점 매트릭스여야 하는지 입니다.굳이 사용자-아이템 평점이 아니여도 사용자의 행동을 나타내는 데이터면 가능한가요?
-
해결됨[개정판] 파이썬 머신러닝 완벽 가이드
precision_recall_curve 와 관련해서 질문있습니다.
안녕하세요! 제가 계속하는데 shape 자체가 달라서 질문 남깁니다.. 강의에서는 반환된 thresholds나 나머지 것들이 147, 148개의 자료들이 생성되는데, 저는 코딩을 다시해봐도 165개, 166개가 나오더라구요.. 제가 어떤 부분에서 놓쳤는지 잘 몰라 질문드립니다.
-
해결됨빅데이터분석기사 필기 올인원: 3주에 끝내는 완벽 대비
가설검정 - 평균검정 예제문제
한 음료 회사는 자사의 콜라 병이 평균적으로 500ml를 담고 있다고 주장한다. 하지만 소비자들은 병에 담긴 콜라의 양이 평균보다 적다고 생각한다. 이를 검증하기 위해 30병(n)의 콜라를 무작위로 선택하여 용량을 측정했다. 측정 결과, 플의 평균 용량은 495ml(x바)였고, 표준편차는 10ml(s)였다. 유의 수준을 0.05로 설정할 때, 콜라의 양이 평균보다 적은지 검정해보자.• 전체 관측치 수 : 30개• 귀무가설(H₀) : mu = 500• 대립가설(H₁) : mu < 500 • 유의 수준 0.05에서, 자유도가 29인 t 분포의 한쪽 꼬리(왼쪽)의 임계값은 -1.699 • 계산된 t-값(-2.74)이 임계값(-1.699)보다 작으므로 유의 수준 0.05에서 귀무 가설을 기각 여기서 임계값은 t분표표에서 찾는 것인가요? 찾는다면 어떤 방식으로 찾는 방법이 있는지 문의 드립니다.
-
미해결[개정판] 파이썬 머신러닝 완벽 가이드
문자열 포맷팅
- 학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요! - 먼저 유사한 질문이 있었는지 검색해보세요. - 강의 내용을 질문할 경우 몇분 몇초의 내용에 대한 것인지 반드시 기재 부탁드립니다. - 서로 예의를 지키며 존중하는 문화를 만들어가요. - 잠깐! 인프런 서비스 운영 관련 문의는 1:1 문의하기를 이용해주세요.세번째 cell에서 print('array1: {:0}차원, array2: {:1}차원, array3: {:2}차원'.format(array1.ndim,array2.ndim,array3.ndim)){:0} {:1} {:2} 이것들이 의미하는게 궁금합니다