묻고 답해요
169만명의 커뮤니티!! 함께 토론해봐요.
인프런 TOP Writers
-
미해결[핵집] 2025 빅데이터 분석기사(필기)_과목 1~2
통합강의안 요청
안녕하세요. 통합강의안 받아보고싶습니다.각챕터별로 받기가 좀 힘드네요..themisist@naver.com입니다.
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
선생님~! 혹시 강의자료 PPT 파일은 어디서 받나요?
강의자료 PPT 제본으로 교재 만들고 싶어서요^^
-
미해결실리콘밸리 엔지니어에게 배우는 파이썬 아파치 스파크
스트리밍 window 관련 질문드립니다.
spark streaming을 설명하시면서 광고로그를 join? 하는걸 예시로 들어주셨는데요, 노출이랑 클릭이랑 interval이 10분~30분 정도가 아니라 7일 이렇게 되는 경우에도 spark streaming으로 처리가 가능한가요?? 궁금합니다.
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
원핫인코딩 질문
5회 기출유형(작업형2)에서 수치형+범주형 활용에서원-핫 인코딩을 실시하실때 범주형 컬럼을 'cols'에 담아 범주형만 실시해야 되는게 아닌가요?선생님 코딩에는 전체 컬럼을 대상으로 원-핫 인코딩을 하는 게 아닌가요?train = pd.get_dummis(train) 가 아닌cols = [범주형 변수들....]train[cols] = pd.get_dummis(train[cols]) 가 맞는 게 아닌가요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
캐글 관련 강의 자료
캐글 관련 강의 자료 마지막에 강의해주신 '작업형1예상문제'와'작업형2예상문제'는 어디에서 확인하나요?캐글에서 "Big Data Certification KR' 에서 확인하나요? 어디에서 찾는지 확인을 할 수 었습니다.
-
미해결15일간의 빅데이터 파일럿 프로젝트
오라클 virtualbox 윈도우11 호스트 전용 네트워크 설정
강의에서는 호환문제때문에 5.0 설치하라고 하셨는데제 노트북에서 설치 후 실행 자체가 되지 않아virtualbox 6.1.44를 다운받았습니다. 근데 네트워크 설정에서 호스트 전용 네트워크 칸이 뜨지 않아서요.어떻게 들어가서 설정해야할까요?저장
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
첨부자료 관련
"4회 기출유형(작업형1) " 에서 첨부 데이터 (basic1.csv 등)는 어디에서 찾아서 작업을 해야 하나요?
-
해결됨[2026 신규] 데이터분석 준전문가(ADsP) 자격증
프로토타이핑과 프로토타입
안녕하세요 선생님, 강의 잘 듣고있습니다. 다름이 아니라 2단원에서 알려주신 프로토타이핑과 프로토타입 은 같은 용어인가요? 프로토타입에 대한 이론 설명 후 풀이해주시는 문제에서는 전부 프로토타입이 아니라 프로토타이밍으로 단어가 사용되어있어서요! 나중에 "일단 분석을 싣해보고 그 결과를 확인해가면서 반복적으로 개선해나가는 기법은?" 이라는 문제가 나오면프로토타입 / 프로토타이핑 중 어떤 이름으로 작성해야 맞는것인지 문의드립니다!
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
에러 확인 부탁드립니다.
1번 문제를 시험환경에서 아래와 같이 코딩하고 실행했는데 아래와 같은 에러가 나타납니다.코랩에서는 잘 실행되던게 시험환경에서만 에러가 납니다. 무엇을 잘 못 한 건가요?a = a[:int(len(a)*0.5)] cond = a['target'] == 0 a = a[cond] print(int(a['proline'].mean()))[에러 내용]
-
해결됨[2026 신규] 데이터분석 준전문가(ADsP) 자격증
이걸 어떻게 받아들여야할지 모르겠습니다
교재 안에서 한 문제 만에 정상성과 정규성이라는 용어가 정답으로 번갈아 등장하는데 정상성은 그냥 틀린 말이라고 생각하면 되는 건가요?실제 기출에서 정상성은 틀린 답안으로 체크가 되었고요
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
섹션 4 - 기출문제 유형파악2021 - 스페셜 게임 - 예시문제 작업형2
학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요먼저 유사한 질문이 있었는지 검색해보세요안녕하세요.아래 링크에 문제 풀이 작성 해봤습니다.피드백 주시면 감사하겠습니다! 섹션 4 - 기출문제 유형파악2021 - 스페셜 게임 - 예시문제 작업형2https://colab.research.google.com/drive/1M2_HMpVPDFk8IheSEDd34Z5sgxheVCI1#scrollTo=eFsvM0T51nzg
-
미해결빅데이터분석기사 실기대비 (R 활용)
예시문제 작업형2번
안녕하세요전처리를 할 때 bagImpute 로 결측치 처리를 전체 했더니, auc >1 로 나오는데이 경우에는 하신 대로 mean 평균으로 대체하는게 맞을까요? scale(데이터, center=TRUE, scale=TRUE) 대신에 preProcess (caret 패키지) 를 추천해주신 이유가 있으실까요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
섹션 3 : "머신러닝"과 줄다리기
안녕하세요.빅데이터 분석기사 교재 보다가 비전공자라 그런지 조금 어려워서 인강까지 흘러오게 되었네요. 앞으로 잘 부탁드립니다 : ) 섹션 3 : "머신러닝"과 줄다리기 > 모델링 및 평가(분류) 문제 1번을 아래 링크와 같이 풀어보았습니다.혹시 이런식으로 푸는게 맞는건지 봐주실 수 있을까요?https://colab.research.google.com/drive/17FKBC1yxD5yHil49ubGXElCm2Tq40kDs#scrollTo=n8EH3M_AgD4k
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
평가지표 기준 관련
안녕하세요? 선생님!작업형 2에서 검증데이터를 분리해서 문제에서 제시한 평가지표로 평가를 수행한 후 어느 정도 점수가 나온 경우에 테스트 데이터로 예측을 하여 답안을 제출하는 것으로 알고 있습니다.점수가 좋지 않은 경우 전처리, 피쳐엔지니어링, 하이퍼파라미터 튜닝 등의 과정을 거쳐서 일정 점수 이상이 나오는지 확인을 한후 테스트 데이터 예측을 하는 것으로 알고 있습니다.그런데, 궁금한 점이 각 평가지표 별로 어느정도 점수 이상이거나 이하로 나와야 답안 제출을 할 수 있는지요? 평가지표별로 어느정도 기준 점수가 있는지요?
-
해결됨빅데이터 파이프라인 마스터; 성공을 위한 도구와 기술
[질문] replication 변경 질문드립니다.
안녕하세요!강의 수강하면서 HDFS 명령어를 구글링하면서 만져보고 있는데요, 강의 실습에서 hdfs-site.xml에서 replication을 1로 설정해서, hdfs setrep 명령어를 사용해 replication configuration 3으로 변경을 시도했다가 잘 되지 않아서 질문드립니다.w 옵션 없이 setrep 3 / 명령어 입력 시에,./bin/hdfs dfs -stat "%b %F %g %n %o %r %u %y %Y" {파일 경로}결과 %r = 3으로 변경이 되는데./bin/hdfs fsck / -files -blocks결과를 확인해보면, Default replication factor가 여전히 1로 나옵니다.Default replication factor를 변경할 수 있는 방법 질문드립니다. 또 기다려도 hdfs에 올린 파일들이 자동으로 복제가 되지 않고 개수가 계속 1이라(fsck 명령어로 상태 확인 시에 missing replicas 확인됨), 강제로 setrep에 w옵션을 사용해서 기다려봤는데, 계속 복제본을 만들지 않는 결과를 확인했습니다.이게 Pseudo Distributed Operation 모드에서 동작을 시켜서 발생시키는 결과인지, 아니면 어떤 부분이 문제일지 질문드립니다.감사합니다.
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
작업형 2번 문제 유형관련 질문
안녕하세요!덕분에 공부 잘 하고 있습니다!다름이 아니라 작업형 2번 문제에 지도학습 중 분류와 회귀 위주로 기출이 나오고 강의를 해주시는데, 비지도 학습의 군집분석이나 연관분석 문제는 배제하고 공부를 해도 될런지요?만약 공부를 해야 한다면 어디를 참조하여 공부를 하면 될까요? (예시문제 등)
-
해결됨[2026 신규] 데이터분석 준전문가(ADsP) 자격증
2-19 주성분분석에 대한 강의가 2-18 차원축소기법 강의 내용 뒷부분과 중복됩니다
2-19의 강의내용이 2-18 차원축소기법의 주성분분석 강의 내용과 동일하네요확인 부탁드립니다!
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
문제3 변환 관련 문의
# your code #데이터 변환은 replace!! import pandas as pd df = pd.read_csv('members.csv') df = df.dropna(subset=['views']) df['f3'] = df['f3'].fillna(0) df = df.replace('silver',1).replace('gold',2).replace('vip',3) df.head(10)위 처럼 numpy를 불러오지 않고, f3컬럼에 결측값을 0으로 먼저 채운 후 변환문을 사용했는데 결과와 데이터프레임이 같아서혹시 이 방법으로 해도 상관 없는건지 여쭤보려고 합니다~ 다시 확인좀 하려고 지웠다가 다시 문의합니다!그리고 map사용 시 #map import pandas as pd df = pd.read_csv("members.csv") df = df.dropna(subset=['views']) dict_list = {np.nan:0, 'silver':1, 'gold':2, 'vip':3} df['f3'] = df['f3'].map(dict_list) print(df['f3'].sum())numpy를 불러야하는것이 맞겠죠?.. 위에서 이미 한번 numpy 불러와서 에러가 발생하지 않은 것 같아서요.
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
모델링 에러 관련
랜덤포레스트 분류 모델링을 하는데 당므과 같은 에러가 나타납니다. 해결 방법이 무엇인가요? "사용 가능한 RAM을 모두 사용한 후 세션이 다운되었습니다."
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
작업형1 모의문제1의 문제3에 대해 여쭙습니다~
공부하다가 마지막 문제3 "f3 컬럼의 결측치는 0, silver는 1, gold는 2, vip는 3으로 변환한 후 총합을 정수형으로 출력하시오"이 문제를 해결할 수 있는 세 개의 비단주머니(…ㅎ)를 알려주셔서 고맙습니다.저 문제에서는 '변환한 후' 총합을 정수형으로 출력하라고 해서요. 마지막 세 번째 방법은 1번과 2번을 모를 때 마지막 궁여지책으로 작성할 방법 같습니다.파이썬이 문법이 쉬운 것 같으면서도 막상 해보려고 하면 어려워서요. ;; 혹시 마지막 세 번째 방법을 저렇게 조건문 식으로 해서 아예 컬럼의 값 자체를 바꿀 수 있는 방법이 있을까요? 오전 내 고민하다가 도저히 안 되겠어서 여쭤봅니다. 이건 뭐 그냥 생각해본 거니까 곤란하시면 답해주지 않으셔도 됩니다. 좋은 강의 정말 감사합니다~