묻고 답해요
160만명의 커뮤니티!! 함께 토론해봐요.
인프런 TOP Writers
- 
      
        
    미해결빅데이터 파이프라인 마스터; 성공을 위한 도구와 기술
crontab 결과가 market.log 에 저장이 안돼요ㅠ
crontab 결과가 market.log 에 저장이 안돼요ㅠcrontab 내용 오타 없는지도 계속 확인했고, 파일 실행도 직접했을 때는 환율 잘 나와요. 로그 파일도 자동 생성이 됐는데cat market.log 하면 아무것도 뜨지 않네요ㅠ 이유가 뭘까요?
 - 
      
        
    미해결15일간의 빅데이터 파일럿 프로젝트
cpu usage 에러
모니터링을 하고 싶은데 위 에러가 뜨더니 이후엔 Magnagement를 켜면 나머지 기능들에 에러가 나서 작동이 아예 안되는 수준입니다.
 - 
      
        
    미해결15일간의 빅데이터 파일럿 프로젝트
쿼리 실행시 10000 에러
이런 에러가 자주 나는데 왜 나는 걸까요? 쿼리실행시 가끔 떠서 여쭤봅니다
 - 
      
        
    미해결15일간의 빅데이터 파일럿 프로젝트
탐색 과정 중 주제2 진행중 발생 에러
ascii 관련 에러가 났는데 어느 부분에서 고쳐야하는지 모르겠어요
 - 
      
        
    해결됨데이터분석 준전문가(ADsP) 자격증 대비
섹션 3- 회귀모형 분석 2 6번 문제 해설
섹션 3의 회귀모형 분석2의 6번문제에 3번선지를 설명하실때, 앞부분의 강의자료에서는 T값이 클수록 회귀계수가 유의하다고 하셨는데 문제에서는 풀 때 T값이 가장 작은 것이 유의한 변수로 선정되는게 맞는 선지로 나와서 제가 개념을 어떤것을 혼동하고 있는것인지 알고싶습니다 정확한 답이 왜 2번인지는 알겠으나 3번선지에대해 의문이 생겨 질 문 남깁니다
 - 
      
        
    미해결15일간의 빅데이터 파일럿 프로젝트
Hue(휴) 설치중 에러
 - 
      
        
    해결됨데이터분석 준전문가(ADsP) 자격증 대비
099-01. 강의는 어디있나요.....
099-01. 강의는 어디있나요.....무료 강의도 아니고 비용을 지불하고 강의를 듣는데, 이런 사소하지만 반복되는 오류들로 흐름은 계속 끊기고 강의 내용이 좋음에도 불구하고 실망스런 감정만 남습니다....포기하고 듣다보니 난데없이 퀴즈 이후에 099-01.이 나오네요. 영상 수정 필요합니다...
 - 
      
        
    해결됨데이터분석 준전문가(ADsP) 자격증 대비
3과목 교안 누락
3과목 교안 241211 에서 092-01이 누락되어 있습니다.
 - 
      
        
    해결됨데이터분석 준전문가(ADsP) 자격증 대비
3과목 3챕터 의사결정나무 강의 영상 오류
3과목 3챕터 의사결정나무 내용 강의와 quiz 해설 강의의 영상이 같습니다. 교안상 090-01부터 06까지의 내용이 누락된 것 같습니다. 해결 부탁 드립니다.
 - 
      
        
    미해결[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
실기시험 항목과 작업형 유형간 설명을 바랍니다.
학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요먼저 유사한 질문이 있었는지 검색해보세요빅분기 실기 작업형 1유형, 2유형, 3유형은대체 무엇을 묻기 위해어떤 기준으로 구분한 것인지 그 설명을 듣고 싶습니다. 그래서 무엇을 정리하고 준비해야 하는지에 대한 정리를 실제 작업형 1,2,3유형 문제를 두고 설명해 주시기 바랍니다.즉, 작업형 문제를 바로 풀기에 앞서이 문제는 무엇을 묻기 위한 문제로 배경지식으로는 무엇이 필요한 것인지문제에 출제 문제의 설명(출제 포인트)을 달아 주시기 바랍니다.빅분기 실기 항목은 데이터수집작업, 전처리작업, 모형구축작업, 모형평가작업이라고 나와 있는데 이것이 각각 작업형 1~3유형에 어디에 해당하는지 설명이 없고, 작업형 1~3유형 또한 데이터수집작업, 전처리작업, 모형구축작업, 모형평가작업 중 어디에 해당하는지 설명이 없습니다. 이러한 내용이 정리되었으면 좋겠습니다. GPT에 물으니 아래와 같은 답변이 나왔는데 맞는지도 검토바랍니다. 빅데이터분석기사 실기 시험에서 작업형 문제는 제1유형, 제2유형, 제3유형으로 구분됩니다. 각 유형은 문제 해결 방식과 요구되는 기술적 접근법이 다릅니다. 작업형 문제 유형별 특징작업형 제1유형 (30점, 3문제, 각 10점)주요 내용: 데이터 전처리 및 기초적인 데이터 분석요구되는 기술:데이터 정리(결측치 처리, 이상치 제거)데이터 변환(스케일링, 원-핫 인코딩 등)간단한 통계 분석(평균, 중위수, 표준편차 등)예제: 주어진 데이터셋에서 특정 열의 결측치를 평균값으로 대체하시오. 작업형 제2유형 (40점, 1문제, 가장 배점 높음)주요 내용: 머신러닝 모델 구축 및 평가요구되는 기술:데이터셋 분할(훈련/테스트 세트)머신러닝 알고리즘 적용(랜덤포레스트, XGBoost 등)모델 성능 평가(정확도, RMSE 등)예제: 주어진 데이터를 이용하여 고객 이탈 여부를 예측하는 분류 모델을 구축하고, 정확도를 출력하시오. 작업형 제3유형 (30점, 2문제, 각 15점)주요 내용: 데이터 시각화 및 고급 데이터 분석요구되는 기술:데이터 시각화(히스토그램, 박스플롯, 산점도 등)군집 분석(K-means, DBSCAN 등)연관 분석(Apriori, FP-Growth 등)예제: 주어진 데이터를 이용해 군집 분석을 수행하고, 각 군집의 평균값을 시각화하시오.시험에서 중요한 점작업형 제2유형(40점)이 가장 중요하므로, 모델 구축과 평가 연습이 필수입니다.시험 환경은 구름IDE 기반이므로, Python(Pandas, Scikit-learn, Matplotlib 등)에 익숙해져야 합니다.제1유형과 제3유형은 기본적인 데이터 처리 및 시각화 능력을 평가하므로, 이를 빠르게 해결할 수 있도록 연습이 필요합니다.
 - 
      
        
    미해결[2025 개정판] 빅데이터분석기사 실기 (with Python)
미세먼지 데이타 문의
- ### 3-1. 파일 준비하기- data_day_2016.xlsx, data_day_2017.xlsx, data_day_2018.xlsx, data_day_2019.xlsx 이 어디에서 받으면 되는지요?
 - 
      
        
    해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
용어 질문
리턴의 의미를 정확히 모르겠습니다단순이 함수 정의된 값을 반복해서 받는다는 의미인건지;;
 - 
      
        
    해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
코드 질문입니다
def hello(): print("안녕하세요!") # 함수 호출 print(hello()) 안녕하세요! None위에 hello()로 단순이 결과값을 도출했을때에는 아래 답변 안녕하세요!만 나왔었는데 print(hello())했을 경우에는 아래에 None까지 나와서 문의드립니다
 - 
      
        
    해결됨데이터분석 준전문가(ADsP) 자격증 대비
교재와 강의가 다른 부분이 많이 있는 것 같습니다.
각 과목별 첫 강의에 있는 교재와 실제 강의에 사용되는 교안이 다른 부분이 많이 보였습니다. 강의의 내용을 최신본으로 생각하고 학습하면 되겠습니까? 그리고 가능하시다면, 첫 강의에 포함된 교재를 최신버전으로 바꾸어 주실 수 있겠습니까?
 - 
      
        
    해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
[재질문] 이전 질문을 다시 드립니다.
학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요먼저 유사한 질문이 있었는지 검색해보세요이전 질문을 다시 드립니다. 질문과는 이질적인 답변이 올라와서 질문을 정확히 전달하기 위해 이미지로 정리하였습니다.확인 요청에 대한 답변을 부탁 드립니다.아울러 아래는 실제 강의 내용입니다. 부산에서 알려진 찍먹 비율이 60%정도고 부먹이 40%정도라고 알려져 있다라고 하구요,수원에서 관찰을 했어요. 찍먹이 1, 부먹이 2라고 하겠다. 수원데이터가 찍먹 1,1,2,2,1 이런 식으로 데이터 값이 나오겠죠. 수원에서 관찰된 데이터가 관찰값이고 부산에 %가 기대도수, 기댓값이다. 나온 관찰값과 기대도수를 카이제곱함수에 넣어주면 끝나는 거다.scipy에 stats모듈이 있고 여기에 카이제곱이 있다.첫 번째 파라미터가 관찰된 빈도리스트고 두 번째 파라미터가 기대빈도 리스트다. 빈도로 넣어주셔야 한다. 이게 가장 중요하다. -> (관찰된 빈도 리스트[ ], 기대빈도 리스트[ ])수원은 카운터 하면 된다. 1이 3개, 2가 2개 즉[3,2] 이렇게 카운터 하면 된다. 기대빈도리스트. 그러니까 지금 퍼센트(%)로 되어 있는데 실수로 퍼센트(%) 그대로 넣는 분들이 계시거든요. 0.6이 있고 0.4가 있다. 이것을 빈도로 변경해줘야 한다. 그래서 수원의 총 개수를 구하고 5개네요. 5씩 곱해주면 된다. [0.6*5, 0.4*5] 이렇게 리스트를 만들고 카이제곱검정에다가 첫 번째 관찰된 빈도리스트 수원값을 넣고, 두 번째 기대빈도 리스트에 부산 데이터를 넣어주면 끝나는 거다. -> 관찰된빈도리스트[수원값], 기대빈도리스트[부산값]이렇게 실행하면 검정통계량 값과 p벨류 값을 구할 수 있다.
 - 
      
        
    해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
작업형3의 범주형 데이터 분석(카이제곱 검정)의 적합도검정 설명에서 질문 드립니다.
학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요먼저 유사한 질문이 있었는지 검색해보세요 작업형3의 범주형 데이터 분석(카이제곱 검정)의 적합도검정 설명에서 질문 드립니다.(2분 38초) 문제풀이에 대해 질문드립니다.문제를 풀기 위해서는 부산의 기대도수가 제시되어야 하지 않나요? 찍먹과 부먹의 비율로부산 0.6, 0.4이고 수원의 기대도수는 1,1,2,2,1 이라고 했을 때[3, 2] 부산의 기대도수가 제시되지 않은 상태에서수원의 기대도수 5를 부산에 그대로 대입하였는데이는 기대도수는 관찰하려는 도시(부산,수원)을 동일하게 맞췄기 때문인건가요. 왜냐하면 문제에서는 공교롭게도 부산의 60%, 40% -> 3:2비율과 수원의 60%, 40%->3:2비율이 동일하기 때문입니다. 즉, 수원이 5면 부산도 동일한 조건으로 해야 한다는 가정을 두는 것인가요? 부산에 경우 기대도수가 일반적으로 타 지역인 수원과 동일하지는 않습니다. 부산은 1,1,1,1,2처럼 수원과 다르게 나올 수 있습니다. 그럼 4, 1이 되니 총개수 5로 곱하면[0.8*5=4, 0.2*5=1]이 되어 부산[3,2]과 수원[4,1]의 빈도는 차이가 납니다. 하지만, 문제에서는 결과가 동일하게 나왔던데요 이처럼 뒷 부분을 이해하지 못했습니다.
 - 
      
        
    미해결데이터분석 준전문가(ADsP) 자격증 대비
또..... 강의 오류.....
의사결정나무 모형과 의사결정나무 quiz 강의가 같아요.저번에 전체 강의 점검 한 번 하신다고 했는데,,,,,,순차적으로 들어야 하는 강의가 중간이 이렇게 계속 끊기고, 글을 남겼다가 기다려서 들어야 하고........ 어떻게 좀 해결이 안되나요?
 - 
      
        
    미해결[실전]텍스톰 TEXTOM 실전 강의: 빅데이터 논문 작성을 위한 텍스트 분석/텍스트마이닝
맥북은 ucinet사용이 제한되나요?
맥북사용자입니다. Ucinet이 깔리지 않아 방법 여쭙니다. 그리고 강의 내용과 현재텍스톰 매뉴얼이 바뀌었네요,혹시 바뀐 버전으로 강의를 들을 수는없는지도 같이 여쭙니다.
 - 
      
        
    해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
커리큘럼 작업형2 모의문제1 18분:-7지점 문의.
학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요먼저 유사한 질문이 있었는지 검색해보세요 제목: 커리큘럼 작업형2 모의문제1 18분:-7지점 문의.내용: 데이터전처리 & 피처엔지니어링을 합친 코너에baseline, label, one-hot이 소개되는데이들이 각각 전처리인지 피처엔지니어링 절차에 해당하는지를 몰라 gpt에 물어보니 baseline은 6) 모델 선택,훈련,평가,최적화Label은 5) 검증 데이터 분리 및 6) 모델 선택, 훈련, 평가, 최적화One-hot은 3) 데이터 전처리 및 4) 피처 엔지니어링에 해당한다고 하네요. 이것은 머신러닝 순서라고 하신 아래의 1~7에서 강의에서는 보시다시피 3)~4)단계인 데이터전처리&피처엔지니어링 코너에서 소개하고 있는데 그 내용과 다른 설명 입니다.(강의에서의 절차 정리)1) 문제정의, 라이브러리/데이터 불러오기(로드)2) 탐색적 데이터분석(EDA)3) 데이터 전처리(결측값제거, 이상치제거)4) 피쳐엔지니어링(모델 성능(예측력) 향상)5) 검증데이터분리(Train/validation나누기)6) 모델 선택,훈련,평가,최적화7) 예측8) csv파일 생성 그렇다고 강의에서 구분하여 설명하지 않으셨고, 주석으로 설명이 달린 것이 없이 왔다갔다 하면서 설명을 하시니 도대체 각각이 어떤 절차에 해당하는지 그 차이를 모르겠고, 지금 어떤 절차 중인지 혼동되며 정리를 하려는데 정리가 안되고 있습니다. 정리를 하기 위해서는 절차별 업무수행 프로세스를 정리해야 하는데 '지금과 같은 상황(절차별 프로세스가 아닌 동일한 유형을 묶어서 설명'하는 방식에서는 절차에 대한 정리를 할 수 없게 됩니다. 정리를 하면 강의 뒤에 가서는 다시 앞으로 가서 수정하기를 반복하시니 정리 했던 것을 다시 정리해야 하거나 정리가 안되는 현상이 자주 발생합니다. 절차적 프로세스를 정리하는 데 유사한 유형별 모음이라면서 서로 다른 절차에 속한 것들을 묶어서 설명하려면 혼동되지 않도록 설명을 적시해 줘야 하나 반복적으로 그러한 습관이 나타나지 않는 것을 보면 이러한 점을 의식하지 않는 것 같다는 인상입니다.실무에 대한 이론 정리 보다는 실무적인 접근을 하시는 것으로 보이며 그래서 실수하는 것을 보여주기 위해 위아래를 오르내리며 수정과정을 되풀이 하여 보여주시는 데 동시에 절차(프로세스)대로 이론을 정리하는 입장에서는 앞에서 정리한 것이 매번 날라간다는 것이고 계속 이런 식이면 정리하기가 어려워 지죠. 현재 시점에서 보면 미래에 발생할 것을 먼저 지금 정리하는 것이 되므로 시점이 꼬이므로 혼선스러워 집니다. 이 강의에서는 정리하는 개념에 대한 고민은 없어 보입니다. 일단 chatgpt의 답변이 맞는지부터 확인을 요청 드립니다.
 - 
      
        
    해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
머신러닝 순서 질문 드립니다.
학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요먼저 유사한 질문이 있었는지 검색해보세요학습 커리큘럼에는데이터불러오기, EDA전처리피처엔지니어링모델링/평가(분류/회귀)평가지표 머신러닝파트에서 정리하신 순서는불러오기EDA전처리피처엔지니어링검증데이터분리모델학습,평가 등예측CSV파일 생성이렇게 구성되었습니다.커리큘럼과 학습정리 순서가 왜 다른지?그럼 둘 중 뭐가 맞는가요? 커리큘럼 작업형2의 모의고사1 에서 머신러닝 풀다보면불러오기-EDA-전처리-피처엔지니어링-검증데이터분리-모델학습,평가까지만 나가고 이 후 예측 부분을 작업하진 않으신 것 같습니다. 맞는지 확인 바랍니다. 설명이 프로세스대로 구분되지 않고 실습 형태로 위 아래 왔다 갔다 전개되어 단계별 경계를 구분할 수 없습니다.