묻고 답해요
161만명의 커뮤니티!! 함께 토론해봐요.
인프런 TOP Writers
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
8회 기출유형(작업형1)
문제3에서 주어진 내용이 시험과 동일한건가욥?? 주어진 데이터에서 ‘co’와 ‘nmhc’ 컬럼을 각각 Min-Max 스케일링하시오.스케일링된 ‘co’, ‘nmhc’ 컬럼의 표준편차를 각각 구하시오.‘co’ 컬럼의 표준편차에서 ‘nmhc’ 컬럼의 표준편차를 뺀 값을 소수점 3자리로 반올림하여 구하시오. 해당 3.에서 2.와 같이 '스케일링된'이라는 말이 없어서 뜬금 없지만(?) 스케일링되지 않은 ‘co’ 컬럼의 표준편차에서 ‘nmhc’ 컬럼의 표준편차를 빼서 출력했는데 이렇게 명확한 형용사가 없어도 앞 내용에 맞게 생각해서 출력해야 할까요??
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
[작업형2] 연습문제 섹션 6 질문드려요
연습 문제 6에서는 다수의 범주, 수치형 컬럼에 결측치가 있는데, 최빈값, 중앙값이 아닌특별히 범주형은 X로 수치형은 -1 으로 결측치를 채운 이유가 있을까요? RandomForest은 결측치가 마킹을 해도 어느정도 학습이 가능하다고 알고 있는데,다른 모델들도 마찬가지로 X, -1으로 마킹해도 학습이 가능한걸까요?아니면 RandomForest만의 장점인가요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
작업형3 연습문제 4~5 일원 분산 분석
연습 문제 일원 분산 분석에서 ols 모델 작성할 때 C( ) 작성 안 하는 게 맞는 건가요? group에 C( )를 해줘야 하는 거 아닌가 궁금해서 질문합니다..!
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
구름 시험 환경에서 display 함수
display(df) 실행했을때 에러가 뜨는데 왜 display() 함수가 실행이 안되나요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
작업형1 결측치 질문
학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요먼저 유사한 질문이 있었는지 검색해보세요df['f1'] = df['f1'].dropna() 안녕하세요 f1컬럼의 결측치 삭제를 선생님처럼 안하고 저처럼하면 왜 결측치 처리가 안될까요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
따옴표 사용
16:19 지점에서 "",'' 따옴표를 다르게 쓰셨는데 혹시 어떤 기준으로 나뉘는 것인지 혹은 신경안쓰고 그냥 통일하지 않아도 되는지 질문드립니다.
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
작업형1 모의문제2 문제6번
이상치 제거한 std값 구하는 코드를 이렇게 작성했는데 제거 전 후 std 값이 정답과 다릅니다. 어느 부분에서 차이가 나는걸까요?norm_col = df[(df['age']>0) & (df['age'].apply(lambda x: True if x == int(x) else False))]['age']std_after = norm_col.std()
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
출력값 ?
값은 같게 나오는데밑에 영어로 같이 나오는 게 무엇인지, 이유를 모르겠습니다. 추가로 random_state는 어떤 기준으로 삼는지와 검증데이터분리에서는 2021인데 이후에는 2022로 바뀌는 이유를 모르겠습니다.
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
출력값이 다르게 나와요
11:56 에 나오는 강사님의 출력값과 다르게 나옵니다. 이유를 모르겠어요...
-
미해결[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
타겟데이터 분류 순서
타겟데이터 분류는 원핫인코딩이랑 레이블 인코딩 두 가지 모두에서 하는 것 맞나요?타겟데이터 분류는 인코딩 전에 해도 상관없나요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
캐글가입문제
이미지 선택을 맞게 여러번 눌렀으나 계속 반복적으로 저렇게 확인 창만 떠서 가입이 되지 않습니다. 어떻게 해야할까요..
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
샘플을 봐도 뭐가 잘못된 건지 모르겠어요ㅜ
둘다 1490rows x 14columns 인데ㅠ
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
[작업형3] 5. 이원분산분석
데이터를 보면 비료유형만 범주형변수인데물주기까지 C(물주기) 처리하는 이유가 궁금합니다.기준이뭔가요?C(비료유형) * 물주기 하면 둘다 C처리 안한거랑 결과같은데둘다 C처리해주면 결과가 바뀌네요..
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
작업형 1 nlargest 자료 데이터프레임만들기
학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요먼저 유사한 질문이 있었는지 검색해보세요# 2) 가장 많이 수강한 과목 필터링 id = df['id_assessment'].value_counts().idxmax() cond = df['id_assessment'] == id df = df[cond] 선생님께서는 이렇게 해주셨는데요 저는 cond = df['id_assessment'].nlargest() 이걸로 최대한 활용해서 민맥스 스케일러를 하고싶은데 nlargest로 뽑은 자료를 데이터프레임형태로 어떻게 만들 수 있을까요 ㅠㅠ 답답해 미치겠습니다
-
미해결[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
빅이시 작업형2 기초-케이스(1~3)
여유가 된다면 추천-케이스(1~3)도 하겠지만, 시간이 촉박하여 우선 기초 먼저 해볼까 합니다코드를 봤는데 로직의 흐름 등 내용 이해는 다 됐습니다.기출 문제를 통해서 제가 타이핑도 직접 해 볼 예정이기도 합니다.다만, 타겟 컬럼명 등 문제지에서 주어지는 내용에 따라 변동되는 부분 별도로 하고 전체적인 코드를 통으로 암기하여 가는거 괜찮을까요..?추천형은 코드가 꽤 길어 통으로 암기하기에 쉽지 않을거 같은데 기초형은 그래도 어찌 외워볼만 하다는 생각이 드네요...!
-
미해결[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
welch 형태도 공부 해야할까요?
분산분석에서 정규성은 만족하는데 등분산성을 만족안하면 welch anova를 구해야 한다고 하는데 이렇게까지 나올지 의견 여쭙습니다. 외울게 많아지니까 부담스러워서요
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
검증용 데이터 부분 질문
검증용 데이터 전후 과정에서 일관된 코드를 만들고 싶은데 과정이 헷갈려서요. ~~ train_test_split(train, target, test_size=0.2, random_state = 0)모의문제에서는 이 부분에서 train.drop('목표컬럼', axis=1), train['목표컬럼'],~ 이렇게 사용하는 것으로 이해했는데 그렇게 진행해도 무방할까요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
상관계수가 가장큰값?
학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요먼저 유사한 질문이 있었는지 검색해보세요안녕하세요 상관계수가 가장 큰 값을 물어보면 차이가 가장 큰값과 같이 절댓값을 씌우나요? 아니면 양수중에서 제일 큰 값을 찾나요?
-
미해결[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
bfill / ffill 관련 질문입니다.
문제 8번의 df.fillna(method='bfill') 관련입니다. bfill의 경우, 데이터 최하단 행에 있는 결측치는 어떻게 해결할 수 있을까요? 마찬가지로 ffill의 경우, 데이터 최상단 행에 있는 결측치는 어떻게 해결 가능한지 궁금합니다.
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
결측치 그냥 최빈값으로 채우는게 무난할까요?
학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요먼저 유사한 질문이 있었는지 검색해보세요연습문제 섹션4결측치 채우기아래와 같이 때려넣어도됩니까? a = train['gender'].mode()[0] train['gender'] = train['gender'].fillna(a) b = train['enrolled_university'].mode()[0] train['enrolled_university'] = train['enrolled_university'].fillna(b) c = train['education_level'].mode()[0] train['education_level'] = train['education_level'].fillna(c) d = train['major_discipline'].mode()[0] train['major_discipline'] = train['major_discipline'].fillna(d) e = train['experience'].mode()[0] train['experience'] = train['experience'].fillna(e) f = train['company_size'].mode()[0] train['company_size'] = train['company_size'].fillna(f) g = train['company_type'].mode()[0] train['company_type'] = train['company_type'].fillna(g) h = train['last_new_job'].mode()[0] train['last_new_job'] = train['last_new_job'].fillna(h)