묻고 답해요
161만명의 커뮤니티!! 함께 토론해봐요.
인프런 TOP Writers
-
미해결실리콘밸리 리더가 알려주는 빅데이터 처리 (Spark)
Free Edition을 사용하는 방법
CSV, PARQUET, DELTA 파일 성능 비교하고 DELTA의 Time Travel 사용하기Pandas vs. Spark 100M & 1B 레코드 처리 성능 비교하기Shuffling JOIN과 Broadcast JOIN 학습하기이 3가지 실습과정 영상을 올ㄹㅕ주시면 좋겠습니다. 예제를 통한 판다스와 스파크 성능 비교부터 실습을 어떻게 진행해야할지 막막하네요.
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
작업형1 모의문제1 - 2번
지문에선 결측치가 30%이상이 되는 컬럼을 찾으라고 했는데, 강사님께서는 len(df)*0.3 을 하셨더라구요. 이건 전체 행 수의 30%를 계산한거 아닌가요?df.isnull().sum() / len(df) * 100 을 통해 나온 값 중에서 30% 이상인 컬럼들을 찾아야하는거 아닌지 여쭤봅니다.지문에선 결측치가 있는 컬럼은 최빈값으로 대체하라고 했는데, 어떤 컬럼의 최빈값이라는게 안나와있기 때문에 df['f3'] == 'gold')이렇게 f3컬럼이라고 지정하는게 맞는지, 아니면 30%미만, 20%이상인 결측치가 있는 컬럼은 '해당 컬럼의' 최빈값으로 대체하고 라고 이해하는게 맞는지 여쭤봅니다!
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
리스트 출력 시 순서 문제
인덱스와 문자의 순서가 잘못 출력되는 것 같아요... 원인이 뭘까요ㅠㅠㅠ?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
체험환경 작업형3 소문제 3번 정규성 검정
체험환경 작업형3의 3번 소문제에 '독립표본 t-검정을 수행하고 p-값을 구하여라.' 라고 되어있으므로, a) 'stats.ttest_ind'를 사용하는 것을 이해하였고,b) 소문제 1~2번의 문제 흐름상 '등분산성을 가진다.'라고 가정되어'equal_var=True'(dafault 값이지만)를 입력하신 것도 이해하였습니다. 궁금한 점은,제가 문제 풀이 후에, 궁금해서 아래와 같이 shapiro 정규성 검정과 levene 등분산성 검정을 해보았는데,shapiro 정규성 검정에서 정상 그룹 데이터가 정규성을 따르지 않는 결과가 나왔습니다. 그렇다면 원래는 비모수 검정(만위트니유)를 해야한다고 생각되는데, 그냥 문제에서 요구한 대로 ttest_ind를 사용해서 푸는 게 맞는건지 헷갈립니다. [실행했던 코드]a = df.loc[df['Classification'] == 1]['log'] b = df.loc[df['Classification'] == 2]['log'] print(stats.shapiro(a)) print(stats.shapiro(b)) print(stats.levene(a,b)) print(stats.ttest_ind(a, b))[출력 값]ShapiroResult(statistic=np.float64(0.9521376332731428), pvalue=np.float64(0.03589547584091299)) ShapiroResult(statistic=np.float64(0.9801637075675661), pvalue=np.float64(0.3916017054819772)) LeveneResult(statistic=np.float64(1.8175868256604175), pvalue=np.float64(0.18027345425360713)) TtestResult(statistic=np.float64(-3.0286077921788532), pvalue=np.float64(0.003039226943143319), df=np.float64(114.0))
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
실기 1유형,2유형,3유형 언어 교차
학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요먼저 유사한 질문이 있었는지 검색해보세요 저번 실기시험에서 낙방할때 R로 작업을 했는데요 1유형을 R로 하고 2,3유형을 python으로 한다거나유형에 따라 교차로 시험 볼수 있나요? 갑자기 생각 안나면 그전에 외웠던거라도 해야 하나 싶어서 여쭙니다
-
해결됨파이썬을 활용한 머신러닝 딥러닝 입문
섹션 10 비지도 학습에 대하여
지도학습 문제를 비지도 학습으로 바꾸어서 해결할 수도 있나요?
-
해결됨안정적인 수익 내는 코인 자동매매 봇 만들기 - 그리드전략 편
자동매매 봇
안녕하세요 강사님!아직 강의를 듣고 있는 중인데요.강의에 있는 자동 매매 봇을 만들면 컴퓨터를 계속 켜 놓고 계속 돌리면 자동으로 매매 매수 되는 걸까요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
문자열 슬라이싱
안녕하세요?문자열 슬라이싱 실습하는데 결괏값에 작은따옴표가 나오든 안나오든 상관 없나요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
그룹별 개수 세기 질문
groupby()로 단순히 “그룹마다 몇 개씩 있는지”만 보고 싶을 때는 count() 말고 size()도 있던데, 두 함수의 차이가 뭔가요?
-
미해결[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
교재 연습문제
선생님, 교재 작업형1 연습문제를 풀어보려고 하는데 연습문제 파일은 어디에 있나요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
작업형 1,문제 7 반복문 질문드립니다.
for i in range(0, 5): list_box = [] for k in range(0, 200): ran_num = random.randint(1,200) list_box.append(ran_num) df[i+2000] = list_box df = df.T제가 이해하기로는 2000 부터 2004까지 5개의 행을 만들고각 행에 200개의 자료를 넣는데 1부터 199 까지의 정수를 넣는다.그렇다면 df.T는 어떤 의미일까요?그리고 randint 이 함수는 랜덤정수를 생성한다는 것일까요? 1부터 200 사이의 정수를랜덤으로 넣는다는 의미가 맞을까요?
-
미해결[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
강의 수강 기간 연장 문의
안녕하세요 강사님,이전에도 같은 질문을 드린 적 있으나 아직 답변을 받지 못해서 다시 한 번 질문 드리는 점 양해 부탁드립니다.제 강의 기한이 이번달 16일까지이지만.. 혹시나 가능하다면 올해 하반기 시험이 열리는 11월 29일까지 강의 기한을 연장할 수 있을지 문의드리고 싶습니다.기간 연장이 안된다면..ㅠㅠ 1.5개월 치 수강료라도 결제하고 싶습니다..ㅠㅠ메일 주소 남겨놓고 갑니다, 답변 해주시면 너무나도 감사하겠습니다!!dabin644@naver.com 감사합니다!
-
미해결[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
10회 기출문제 pdf파일
10회 기출문제 pdf 파일은 언제 올라오나요? 교제도 없는 내용이라 이 점 궁금합니다.
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
시험환경 관련 질문드려요
학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요먼저 유사한 질문이 있었는지 검색해보세요 안녕하세요.시험시 코드 실행이 어떻게 되는지 질문드립니다!코랩에서는 셀별 실행이 가능해서 결과를 보면서 할 수 있었는데,시험장에서 '코드 라인별 실행 불가' 관련해서 제가 이해한게 맞는지 확인차 질문 남깁니다. 1. 문제당 전체 실행 결과만 볼 수 있다고 보면 될까요?최종 결과만 나오기 때문에 print로 중간중간 값을 찍어야 한다고 하신 것이라고 이해했는데 맞는지 확인부탁드립니다~ 2. 강의들으면서 colab에서 shift+enter로 실행하는 습관(?) 이들었는데 시험환경에서는 활용이 불가능한 것이겠죠? 좋은강의 감사합니다
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
데이터 불러오기
from google.colab import filesupload = files.upload() 위 명령어 실행없이 바로 데이터 불러올수없나요?퇴근후딴짓님처럼 바로 df=pd.read_csv("members.csv")로 불러오고싶은데 에러가 나네요No such file or directory:members.csv
-
미해결[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
10회 기출 강의 업데이트 문의
안녕하세요. 10회 기출에 대한 강의 업데이트가 언제 될까요??10월까지라고만 명시되어 있어서요, 대략 언제쯤 인지 궁금합니다..
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
상위 25% 데이터 구하기 및 최대값의 인덱스 구하기 질의(제13강_판다스4 - 문자열, 내장 함수 관련))
1) 해당 부분에서 비교연산자가 이상/이하가 아니고 초과/미만을 사용하고 있는데분위수값에 해당하는 값이 있으면 그 결과가 다를꺼 같아서요.25% 데이터 구하세요 하는 문제는 정의자체가 분위수값 미만의 값 이런식으로 정해진건가요? 2) 하위 25% 데이터를 구하는 함수가 있다면, 상위 25%는 ~ 를 이용해서도 함수를 쓸 수 있을까요?3) 가장 큰 값이 두개 이상인경우 더 앞선것을 불러오던데, 해결방법이 있을까요? (가장 큰 값이 동일한경우 모든 인덱스를 불러오게끔)
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
4-1 작업형 모의문제1 질문
13:08 3번문제 풀이 중 강사님도 동일하게 입력했는데 제 데이터파일에 문제 있는건지.. 이유를 잘 모르겠어서 해결책을 찾고자 질문 남깁니다.
-
미해결[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
display
학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요먼저 유사한 질문이 있었는지 검색해보세요안녕하세요 선생님.시험 환경에서는 display가 활성되진 않나요?코랩에서만 되는걸까요.
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
시험시 데이터 읽는법
시험에서 아래와 같은 데이터 불러오는 코드도 필요한가요?from google colab import filesupload =files.upload()df=pd.read_csv("members.csv")