묻고 답해요
158만명의 커뮤니티!! 함께 토론해봐요.
인프런 TOP Writers
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
[재질문] 이전 질문을 다시 드립니다.
학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요먼저 유사한 질문이 있었는지 검색해보세요이전 질문을 다시 드립니다. 질문과는 이질적인 답변이 올라와서 질문을 정확히 전달하기 위해 이미지로 정리하였습니다.확인 요청에 대한 답변을 부탁 드립니다.아울러 아래는 실제 강의 내용입니다. 부산에서 알려진 찍먹 비율이 60%정도고 부먹이 40%정도라고 알려져 있다라고 하구요,수원에서 관찰을 했어요. 찍먹이 1, 부먹이 2라고 하겠다. 수원데이터가 찍먹 1,1,2,2,1 이런 식으로 데이터 값이 나오겠죠. 수원에서 관찰된 데이터가 관찰값이고 부산에 %가 기대도수, 기댓값이다. 나온 관찰값과 기대도수를 카이제곱함수에 넣어주면 끝나는 거다.scipy에 stats모듈이 있고 여기에 카이제곱이 있다.첫 번째 파라미터가 관찰된 빈도리스트고 두 번째 파라미터가 기대빈도 리스트다. 빈도로 넣어주셔야 한다. 이게 가장 중요하다. -> (관찰된 빈도 리스트[ ], 기대빈도 리스트[ ])수원은 카운터 하면 된다. 1이 3개, 2가 2개 즉[3,2] 이렇게 카운터 하면 된다. 기대빈도리스트. 그러니까 지금 퍼센트(%)로 되어 있는데 실수로 퍼센트(%) 그대로 넣는 분들이 계시거든요. 0.6이 있고 0.4가 있다. 이것을 빈도로 변경해줘야 한다. 그래서 수원의 총 개수를 구하고 5개네요. 5씩 곱해주면 된다. [0.6*5, 0.4*5] 이렇게 리스트를 만들고 카이제곱검정에다가 첫 번째 관찰된 빈도리스트 수원값을 넣고, 두 번째 기대빈도 리스트에 부산 데이터를 넣어주면 끝나는 거다. -> 관찰된빈도리스트[수원값], 기대빈도리스트[부산값]이렇게 실행하면 검정통계량 값과 p벨류 값을 구할 수 있다.
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
작업형3의 범주형 데이터 분석(카이제곱 검정)의 적합도검정 설명에서 질문 드립니다.
학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요먼저 유사한 질문이 있었는지 검색해보세요 작업형3의 범주형 데이터 분석(카이제곱 검정)의 적합도검정 설명에서 질문 드립니다.(2분 38초) 문제풀이에 대해 질문드립니다.문제를 풀기 위해서는 부산의 기대도수가 제시되어야 하지 않나요? 찍먹과 부먹의 비율로부산 0.6, 0.4이고 수원의 기대도수는 1,1,2,2,1 이라고 했을 때[3, 2] 부산의 기대도수가 제시되지 않은 상태에서수원의 기대도수 5를 부산에 그대로 대입하였는데이는 기대도수는 관찰하려는 도시(부산,수원)을 동일하게 맞췄기 때문인건가요. 왜냐하면 문제에서는 공교롭게도 부산의 60%, 40% -> 3:2비율과 수원의 60%, 40%->3:2비율이 동일하기 때문입니다. 즉, 수원이 5면 부산도 동일한 조건으로 해야 한다는 가정을 두는 것인가요? 부산에 경우 기대도수가 일반적으로 타 지역인 수원과 동일하지는 않습니다. 부산은 1,1,1,1,2처럼 수원과 다르게 나올 수 있습니다. 그럼 4, 1이 되니 총개수 5로 곱하면[0.8*5=4, 0.2*5=1]이 되어 부산[3,2]과 수원[4,1]의 빈도는 차이가 납니다. 하지만, 문제에서는 결과가 동일하게 나왔던데요 이처럼 뒷 부분을 이해하지 못했습니다.
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
커리큘럼 작업형2 모의문제1 18분:-7지점 문의.
학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요먼저 유사한 질문이 있었는지 검색해보세요 제목: 커리큘럼 작업형2 모의문제1 18분:-7지점 문의.내용: 데이터전처리 & 피처엔지니어링을 합친 코너에baseline, label, one-hot이 소개되는데이들이 각각 전처리인지 피처엔지니어링 절차에 해당하는지를 몰라 gpt에 물어보니 baseline은 6) 모델 선택,훈련,평가,최적화Label은 5) 검증 데이터 분리 및 6) 모델 선택, 훈련, 평가, 최적화One-hot은 3) 데이터 전처리 및 4) 피처 엔지니어링에 해당한다고 하네요. 이것은 머신러닝 순서라고 하신 아래의 1~7에서 강의에서는 보시다시피 3)~4)단계인 데이터전처리&피처엔지니어링 코너에서 소개하고 있는데 그 내용과 다른 설명 입니다.(강의에서의 절차 정리)1) 문제정의, 라이브러리/데이터 불러오기(로드)2) 탐색적 데이터분석(EDA)3) 데이터 전처리(결측값제거, 이상치제거)4) 피쳐엔지니어링(모델 성능(예측력) 향상)5) 검증데이터분리(Train/validation나누기)6) 모델 선택,훈련,평가,최적화7) 예측8) csv파일 생성 그렇다고 강의에서 구분하여 설명하지 않으셨고, 주석으로 설명이 달린 것이 없이 왔다갔다 하면서 설명을 하시니 도대체 각각이 어떤 절차에 해당하는지 그 차이를 모르겠고, 지금 어떤 절차 중인지 혼동되며 정리를 하려는데 정리가 안되고 있습니다. 정리를 하기 위해서는 절차별 업무수행 프로세스를 정리해야 하는데 '지금과 같은 상황(절차별 프로세스가 아닌 동일한 유형을 묶어서 설명'하는 방식에서는 절차에 대한 정리를 할 수 없게 됩니다. 정리를 하면 강의 뒤에 가서는 다시 앞으로 가서 수정하기를 반복하시니 정리 했던 것을 다시 정리해야 하거나 정리가 안되는 현상이 자주 발생합니다. 절차적 프로세스를 정리하는 데 유사한 유형별 모음이라면서 서로 다른 절차에 속한 것들을 묶어서 설명하려면 혼동되지 않도록 설명을 적시해 줘야 하나 반복적으로 그러한 습관이 나타나지 않는 것을 보면 이러한 점을 의식하지 않는 것 같다는 인상입니다.실무에 대한 이론 정리 보다는 실무적인 접근을 하시는 것으로 보이며 그래서 실수하는 것을 보여주기 위해 위아래를 오르내리며 수정과정을 되풀이 하여 보여주시는 데 동시에 절차(프로세스)대로 이론을 정리하는 입장에서는 앞에서 정리한 것이 매번 날라간다는 것이고 계속 이런 식이면 정리하기가 어려워 지죠. 현재 시점에서 보면 미래에 발생할 것을 먼저 지금 정리하는 것이 되므로 시점이 꼬이므로 혼선스러워 집니다. 이 강의에서는 정리하는 개념에 대한 고민은 없어 보입니다. 일단 chatgpt의 답변이 맞는지부터 확인을 요청 드립니다.
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
머신러닝 순서 질문 드립니다.
학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요먼저 유사한 질문이 있었는지 검색해보세요학습 커리큘럼에는데이터불러오기, EDA전처리피처엔지니어링모델링/평가(분류/회귀)평가지표 머신러닝파트에서 정리하신 순서는불러오기EDA전처리피처엔지니어링검증데이터분리모델학습,평가 등예측CSV파일 생성이렇게 구성되었습니다.커리큘럼과 학습정리 순서가 왜 다른지?그럼 둘 중 뭐가 맞는가요? 커리큘럼 작업형2의 모의고사1 에서 머신러닝 풀다보면불러오기-EDA-전처리-피처엔지니어링-검증데이터분리-모델학습,평가까지만 나가고 이 후 예측 부분을 작업하진 않으신 것 같습니다. 맞는지 확인 바랍니다. 설명이 프로세스대로 구분되지 않고 실습 형태로 위 아래 왔다 갔다 전개되어 단계별 경계를 구분할 수 없습니다.
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
최근(어제) 질문이 사라졌습니다.
학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요먼저 유사한 질문이 있었는지 검색해보세요어제 제가 올린 질문이 이곳에 노출이 안 되었고, 24년 11월 29일이 마지막 질문으로 11월 29일 이후 질문이 노출 되지 않았습니다.
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
평가지표 문의
학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요먼저 유사한 질문이 있었는지 검색해보세요이 강의를 보면서 이 강의가 학습을 시키기 위한 정식 강의인지, 대충 이런 게 있다고 그냥 넘어가기는 그렇고 적당히 소개하고 말려고 한 강의인가요?엄청난 속도로 위아래 올라갔다 내려가며 쫓기듯이 강의하시는데... 이것이 최선인건지,, 초심자를 위한 최적화된 강의가 과연 맞는 것인지..정신없어서 뭐가 뭔지 손을 못 대겠던데요. 교안으로 제공하면 출력해서 노트하며 복습이라도 할 텐데 이거 뭐 어쩌란 건지 도무지 모르겠습니다.초급자에게 이 강의를 이해 시키려고 하신 강의 맞으신가요?또는 이 강의를 이해하지 못하면 어떻게 되는 걸까요? 이 강의를 어떻게 해석해야 하는지 설명을 요청 드립니다.빅분기가 결국 결과물을 시각화 하는 과정인데 강의에서는 말로만 하고 시각화된 자료도 제공이 되야 효율적이지 않을까 합니다.따라하는 것도 따라하는 것이지만 머리에 한계가 있잖아요. 강사는 아는 내용을 막힘없이 설명하는 것이고, 초심자는 말하는 족족 그대로 머리에 익혀지지 않잖아요.
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
평가지표(이진/다중 분류, 회귀) 3분지점에 대해 보충 설명을 요청합니다.
학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요먼저 유사한 질문이 있었는지 검색해보세요평가지표(이진/다중 분류, 회귀) 3분지점의 설명에 대해 보충 설명을 요청합니다. train데이터는 학습을 하고test데이터는 예측을 한다고 했으나 train데이터를 분리하여 하나는 학습 다른 하나는 검증이라고 하여 이걸(검증) 예측이라고 설명했어요. 그럼 test의 예측과 train 검증에서의 ‘예측’의 차이는 뭔지 이 둘은 같은건지? train데이터의 레이블로 데이터를 검증한다고 했는데 레이블은 실제값이고 검증하는 데이터는 예측값(pred)라고 하여 이 둘을 비교한다고 했습니다. 검증하는 데이터가 예측값? 여기서도 test데이터(예측값)와 어떤 관계인지 이 개념을 이해 못하겠습니다.
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
코드 질문입니다
#주어진 리스트의 최대값 - 최소값을 구하는 함수를 만드시오#listbox = [15,46,78,24,56]아래와 같이 코드를 짜봤는데 오류가 왕창 뜨더라구요혹시 뭐가 잘못되었나요listbox = [15,46,78,24,56] def maxmin(data): max = max(data) min = min(data) t = max-min return t print(maxmin(listbox))
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
강의 연장 관련 문의
올해 4학년 올라가는 대학생입니다. 제가 작년에 강의 결제하고 학교 다니느라 바빠 시험 공부를 미루다가 올해 시험을 준비하려 하는데 강의 수강 기간이 한달밖에 남지 않아 공부할 시간이 부족할 것 같은데 혹시 연장가능할까요 강사님 ㅠㅠ 메일 주소는 stnow7@gmail.com 입니다!
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
코드 질문입니다
주피터 노트북 마지막 행은그냥 숫자로 346 치면 답이 346뜨던데box = 10 만 쳣을 경우답이 안뜨던데 있는 그대로 box = 10이 안나오는이유는 무엇인가요
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
코드 질문입니다
type(true)type(false)요렇게 적었는데 답이 bool 왜 하나만 뜨나요boolbool두개 떠야 하는거 아닌가요
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
코드 질문입니다
데이터 분석을 위한 파이썬 기초 1 부분에서아래와 같이 print 단어 생략하고 바로 문자 덧샘했을때 작은 따옴표가 원래 생성이 되는 건가요? 없어야 하는거 아닌지 문의드립니다!print("파이썬은 멋지다")-> 파이썬은 멋지다"he" + "llo"-> 'hello'
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
9회 기출 언제 나올까요?
안녕하세요. 9회 실기를 합격하긴 했지만, 어려웠던 문제들이 있어서 다시 공부해 보고 싶은데,9회 기출을 언제 쯤 업데이트 하실 예정인지 궁금해서 질의합니다.
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
묻습니다. 질의 하기 전에 체크해야 할 것
학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요먼저 유사한 질문이 있었는지 검색해보세요묻습니다. 영상을 시청하다 멈추고 이곳에 질문을 남기면, 영상 시청 지점도 자동으로 기록 저장 되고 있는지 그 기능에 대해 묻습니다. 앞서 영상에서 오름차순 내림차순 관련 질의를 했으나 질문 의도와는 다른 답변을 보고, 제가 질의하게 된 영상 지점을 확인 하지 않은 듯한 인상이었습니다. 영상의 해당 지점을 질의하려면 강의 제목을 다시 확인하고 해당 지점의 시간을 직접 기록해야 하는지 그러한 안내를 바랍니다.
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
주피터 노트북
실습 환경 안내 강의를 시청했습니다주피터 노트북이라는게 구글 코랩 실행에서 나오는 코드입력 화면을 주피터 노트북이라고 지칭한다고 생각하면 되는 건가요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
파이썬 창 우측 상단에 테스트 버튼 기능은 뭔가요?
파이썬 창 우측 상단에 테스트 버튼 기능은 무엇인가요?
-
미해결[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
오름차순과 내림차순 질문
학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요먼저 유사한 질문이 있었는지 검색해보세요이 지점에서 sort_values를 했는데 소팅 시 기본값으로 ascending 오름차순(1->5) 나오는 것을 정확히 설명해 주지 않으셨고, 왜냐하면 그 결과 오름차순이 나왔어요.그런데 원하는 것은 내림차순 descending (5->1)이라고 하셨는데 정작 코드는 ascending(오름차순)으로 적어서 실행했는데 신기하게 내림차순이 정렬되었습니다.전 이 지점 이해 못했습니다. 설명 바랍니다.
-
미해결[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
강의 일시정지 문의 드립니다
안녕하세요 이번 9회차 실기 시험을 봤는데.. 합격을 하지 못했습니다ㅜㅜ내년 상반기에 10회 실기 시험을 다시 응시하려고하는데.. 강의가 4월2일에 만료라서..혹시나 3개월정도 일시정지 가능할까요?내년 시험기간쯔음에 다시 공부해서 꼭합격 하고 싶어요ㅜㅜㅜㅜ 다른 문의글 보니 메일주소를 남겨달라는 답변을 모아서 남깁니다메일주소는 topk49@naver.com 입니다ㅜㅜ
-
해결됨[2025년 최신 기출 반영] 빅데이터 분석 기사 실기 시험 100% 합격 ! 기출 문제의 패턴이 보인다 !
교통사고 유형별 검거율 계산하고, 각 연도별로 최고 검거율과 사고유형에 대해서
교통사고 유형별 검거율 계산하고, 각 연도별로 최고 검거율과 사고유형에 대해서 궁금한 것이 있어요.최고 검거율과 관련해서 데이터가2018년 음주운전 발생 9102019년 음주운전 발생 11322020년 음주운전 발생 24132018년 음주운전 검거 8192019년 음주운전 검거 19492020년 음주운전 검거 4064라고 되어 있는데.. 발생보다 검거가 더 많이 나오는건 데이터를 램던으로 발생시켜서 그런걸로 이해하면 될까요 ?그리고 발생연도마다 최고 검거율을 뽑아내는데, 다른 컬럼이 분명 검거율이 높은데(예를 들어 1.xxx) 이를 보지 않고 특정 컬럼이 검거율이 높다고 설명을 주시니, 혼돈이 있습니다. 무슨 말인지 영상을 두번 돌려봐도 이해가 안되네요.. 데이터에 맞게 설명을 주시는건지, 아니면 기출에 맞게 주시는건지.. 2018년도 검거율이 가장 높은게 신호위반 0.79 라고 말씀을 주시는데, 같은 라인에 검거율이 가장 높은게 화물차사고 16.411 이라고 보여지는데. 어떻게 해석해야하나요 ?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
corr()이 작동하지 않는 문제
안녕하세요. 먼저 좋은 강의 감사드립니다.저는 이번 9회 시험에서 1유형 30점, 2유형 40점, 3유형 20점 총 90점으로 합격했습니다. 퇴근후딴짓 선생님의 좋은 강의 덕분이라고 생각합니다. 다만 시험 중에 이상한 일이 있었습니다.이번 3유형에 상관계수를 구하는 문제가 있었는데요, 제가 시험장에서 corr() 메서드를 사용했을 때 작동하지 않았습니다.자료형이 틀렸거나 옵션 문제 등의 오류가 아니라, 확실히 not defined로 기억합니다. corr() 메서드 호출 자체가 불가능했습니다. 몹시 당황해서 이런저런 라이브러리를 불러도 보고, dir, help 등도 시도해봤지만 호출 자체가 안 되니 할 수 있는 방법이 없더라고요.마지막으로 통계학 지식을 동원해 수작업 계산을 시도했지만, 결국 시간 부족으로 corr()이 필요했던 두 문제를(각 5점) 틀리게 되었습니다. 혹시 이런 문제가 발생하는 경우에 대해 아시는 바가 있을까요?합격과는 별개로 너무 궁금하고 답답해서 문의를 드립니다.