묻고 답해요
158만명의 커뮤니티!! 함께 토론해봐요.
인프런 TOP Writers
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
평가지표
학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요먼저 유사한 질문이 있었는지 검색해보세요선생님, 진짜 너무 어려워요. 강의를 하기전에, 코드를 쓰는 배경, 코드를 해석해주는 등등 이해를 좀 시켜주세요. 초심자 눈높이에 좀 맞춰주세요... 혼자 너무 위아래로 왔다갔다 하시면서 , 뭔가 따라 써보려고해도 어디서부터 어떻게 따라써야하는지 기준도 없어서 너무 헷갈립니다. 어떤식으로 공부해야하는지 방향성도 알려주시면 감사하겠습니다.
-
미해결[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
원핫인코딩 에러
학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!세요질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요먼저 유사한 질문이 있었는지 검색해보train = pd.get_dummies(train, columns=cols) test = pd.get_dummies(test, columns=cols) display(train.head(2)) display(test.head(2))KeyError Traceback (most recent call last) <ipython-input-52-5da4ae8d05fa> in <cell line: 0>() 1 # 원핫 인코딩 ----> 2 train = pd.get_dummies(train, columns=cols) 3 test = pd.get_dummies(test, columns=cols) 4 display(train.head(2)) 5 display(test.head(2)) 3 frames/usr/local/lib/python3.11/dist-packages/pandas/core/indexes/base.py in _raise_if_missing(self, key, indexer, axis_name) 6247 if nmissing: 6248 if nmissing == len(indexer): -> 6249 raise KeyError(f"None of [{key}] are in the [{axis_name}]") 6250 6251 not_found = list(ensure_index(key)[missing_mask.nonzero()[0]].unique()) KeyError: "None of [Index(['sex', 'smoker', 'region'], dtype='object')] are in the [columns]"
-
해결됨데이터분석 준전문가(ADsP) 자격증 대비
그래프 종류(Quiz) 강의 질문
문제 7번에서,2번 선택지와 같이 편차를 비교하려면최대/최솟값의 차 or Q3/Q1값의 차둘 중 어느 것을 보는게 정확한가요?
-
해결됨데이터분석 준전문가(ADsP) 자격증 대비
그래프 종류(Quiz) 강의 문의
해당 강의에서 문제1번 질문드립니다.선택지 3번에서,수염은 최대/최솟값이므로 틀린 말 아닌가요?하위 25%와 상위 25% 범위는 수염이 아닌 상자로만 판단할 수 있는 걸로 알고있어서요.
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
빅분기 실기책 2판 언제쯤 나오나요?
10회 필기 응시 후, 빅분기 시나공 2판 기다리고 있는데 언제쯤 나올까요? 기다리고 있습니다ㅎ
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
이원분산분석에서 등분산성 만족하지 않을 경우
안녕하세요! 시험과는 조금 무관한 부분일 수 있으나 강의 들으면서 궁금해 문의 드립니다. 만약 levene을 통해서 한 집단이라도 등분산성을 만족시키지 못하는 경우, 어떤 검정을 사용해야 하나요?감사합니다!
-
미해결로그프레소 시작하기
fulltext "3433" and "tcp" from index_delims 관련해서 질문
fulltext "3433" and "tcp" from index_delims 쿼리 방법 말고 인덱스 생성해서 하는 방법이 있다. 라고 하셨고 그 방법은 구분자 토크나이저로 하고 토크나이저 설정시 구분자를 넣으면 된다. 라고 하셔서 테스트를 아래 내용처럼 했는데 안 됩니다. 확인 부탁드립니다.실습 내용 : 목표 : 로그 속의 service=3433/tcp 검색을 위해 "3433" and "tcp" 방법 말고, index을 사용해서 찾기테이블 이름 : index_delims인덱스 이름 : idx_spec토크나이저 : 구분자기존 데이터에 대한 인덱스 빌드 여부 : . 사용. 2016-02-02토크나이저 설정 : 키 : 구분자값 : /만든 후, fulltext "3433/tcp" from index_delims.idx_spec 쿼리 질의 하니 검색건이 0건입니다;;;;
-
미해결[핵집] 2025 빅데이터 분석기사(필기)_과목 1~2
통합강의자료 부탁드립니다
통합강의자료 부탁드립니다~~beeran@hanmail.net
-
미해결빅데이터/텍스트마이닝 분석법 (LDA,BERTtopic,감성분석,CONCOR with ChatGPT)
질문드립니다.
안녕하세요 강의 잘듣고 있습니다. 감사합니다.실습 내용 중에 질문이 있습니다.워드클라우드 그리는 예시에서 워드클라우드에서 '했다', '하는', '한다' ,' 밝혔다' 이런 동사 형태가 많이 보이는데 어떻게 해결 해야 할까요?워드클라우드에서 '인공지능'이 '인공', '지능' 으로 분리되어 나타나는데 '인공지능'으로 합쳐서 집계되고 표현되게 하려면 어떻게 하나요?'오늘', '현재', '한국', 오후' 이런 단어는 지우고 싶은데 어떻게 하면 되나요? 전처리 과정을 어떻게 해야하는지 궁금합니다..!답변 부탁드립니다. 감사합니다.
-
미해결[핵집] 2025 빅데이터 분석기사(필기)_과목 1~2
기간 연장가능할까요?ㅠㅠ
기간 연장가능할까요?ㅠㅠ
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
Wilcoxon 검정 시 양측 검정?
강의에서 Wilcoxon 검정 시 단측 검정만 나왔는데, 양측 검정은 어떻게 하나요?
-
미해결[EduAtoZ] 빅데이터분석기사 필기
시공간데이터
공간데이터는 공간과 시간데이터를 따로 추출할수있는데, 계산에 의해서는 추출못한다는건 무슨의미일까요?일반적으로 공간데이터와 시간데이터가 따로 관리될때는 추출을 할 필요가 있나요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
데이터 생성코드 실제 시험환경 문의
# 데이터 생성(먼저 실행해 주세요) import pandas as pd import random random.seed(2022) df = pd.DataFrame() for i in range(0, 5): list_box = [] for k in range(0, 200): ran_num = random.randint(1,200) list_box.append(ran_num) df[i+2000] = list_box df = df.T df.to_csv("data.csv", index=True)이렇게 가장먼저 데이터생성하는 코드가 디폴트값으로 적혀있는데, 실제 빅분기시험에서도 이렇게 첫 스타트를 끊는 부분은 저희가 처음부터 별도로 코딩을 하지않아도되는건가요? 실제 시험에서는 어떻게 진행되는지 궁금하네요... 처음부터 문제 읽자마자 데이터 생성을 하고 시작해야하는건지 아니면 데이터 생성코드가 입력되어있으면 그냥 코드실행바로 누르고 시작하는건지 알려주세요
-
미해결모두의 한국어 텍스트 분석과 자연어처리 with 파이썬
감성 분석을 하려면 어떤 부분을 공부해야 하나요?
프로젝트에서 감성 분석과 주제 찾는 작업이 필요합니다.주제 찾기는 강의를 통해 배울수 있을거 같은데요 감성 분석은 어떤것을 공부하면 좋을까요?
-
미해결[핵집] 2025 빅데이터 분석기사(필기)_과목 1~2
통합 강의 자료 요청
안녕하세요.통합 강의 자료 요청 드립니다.jis22u@gmail.com감사합니다.
-
미해결15일간의 빅데이터 파일럿 프로젝트
호스트 불량 문제에 관하여
안녕하세요, 강사님. 강의대로 진행했음에도 불구하고 계속 사진처럼 빨갛게 뜹니다. 제가 처음에 클라우데라 매니저 설치할 때 실수를 반복하여 클러스터를 세 번 정도 설치했다가 삭제하고 마지막으로 한 번 더 제대로 설치했는데, 이전에 설치했던 parcel 혹은 다른 잔여 파일이 남아서 그런 걸까요? parcel을 설치할 때마다 c 디스크 공간이 줄어들었던 걸 보면 잔여 파일이 남은 것 같긴 한데 어떻게 삭제해야 할까요?
-
해결됨실리콘밸리 엔지니어에게 배우는 파이썬 아파치 스파크
BroadCast 지원 가능 메모리 문의
안녕하세요.최근부터 Spark 강의를 듣고있는데 이해하기 쉽게 설명 해주셔서 감사합니다. Broadcast에 대해서 설명을 해주셨는데 Join 대상이 큰 빅데이터 이거나, meta에 큰 데이터를 담을 경우에는 Broadcast를 사용 하지 못한다고 설명해주셨는데요, 혹시 Broadcast에서 지원할 수 있는 최대 메모리가 있을까요? 그리고 Join대상 데이터가 A, B, C, D ID로 이뤄진 TB 사이즈의 테이블이라고 했을 경우 meta에 A, B, C, D ID에 대한 Name을 Brodcast할 경우 위 테이블과 맵핑하여 사용이 가능할까요?
-
해결됨[2025] SQLD 문제가 어려운 당신을 위한 노랭이 176 문제 풀이
DATA_FORMAT문제
DATE_FORMAT(날짜, 형식)문자열을 지정된 날짜 형식으로 포맷팅하는 함수입니다.이 문제의 경우 DATE_FORMAT 함수는 MySQL에서 지원되며, 반환 값은 문자열이므로 조건이 맞지 않습니다.예: DATE_FORMAT('2022-11-02', '%Y-%m-%d') → '2022-11-02' (문자열) 학습노트에 DATA_FOMAT함수 문자열 조건이 맞지않는다고 써져있는데 3번문항이 '2022-11-02' 이렇게 문자열로 나와야한다는건가요..?그럼3번문항도 ''로 감싸진 문자열이아니니틀렸다는건가요 ?
-
해결됨[2025] SQLD 문제가 어려운 당신을 위한 노랭이 176 문제 풀이
노랑이 39P 15번문제
FROM (SELECT (LENGTH(C1) -LENGTH(REPLACE(C1,CAR(10))+1 CCFROM TAB1 이부분에서 LENGTH(REPLACE(C1,CAR(10))+1+1이라는게 C1의 ROWNUM1이 >ROWNUM2를 가르키나요? 저는 C1 ROW1을 공백제거해서 2C2ROW2를 공백제거해서 3 해서2+3=5 여기에 +1일해서 6이 정답인줄알았는데+1이 정확히 뭘의미하는지잘모르겠어요ㅜ
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
종자와 비료의 p밸류값
8:42에서 종자의 p밸류값은 7.254117e-10비료의 p밸류값은 1.835039e-03으로 나오는데요.둘다 귀무가설을 기각하여 '토마토수'에 영향을 준다는 사실은 이해를 했습니다. 궁금한 점은 p밸류값이 종자가 비료보다 훨씬 수치가 작은데 그렇다면 '종자'가 '비료'보다 토마토수에 더 영향을 끼친다고 해석해도 괜찮은가요?