묻고 답해요
161만명의 커뮤니티!! 함께 토론해봐요.
인프런 TOP Writers
-
해결됨데이터분석 준전문가(ADsP) 자격증 대비
59 확률분포 차례인데 58 확률 기본 용어 강의가 동일하게 나옵니다.
이전 강의(확률 기본 용어)와 내용이 같습니다....... 인프런의 다른 강의들은 안그런데, 이 강좌는 유난히도 교재 및 강의영상 관련 문의가 많네요. 한 번에 쭉 점검 한 번 해주시는게 어떨까요....... 순서대로 들어야 하는데, 질의 남기고 기다렸다가 자료나 동영상 다른데서 봐야하고. 강의 수강일수도 정해져 있는 강의인데, 흐름이 엄청 끊깁니다.
-
해결됨실리콘밸리 엔지니어에게 배우는 파이썬 아파치 스파크
강의 후반부에 나온 실습 코드는 어디서 받을 수 있나요?
강의 후반부에 나온 lecture25에 대한 코드가 강의 자료에 없는 것 같습니다. 혹시 있다면 어디서 받을 수 있나요?
-
해결됨데이터분석 준전문가(ADsP) 자격증 대비
교재에 내용이 없습니다. & 강의가 없습니다.
[S3] 057-08. 분포 통계량 - 첨도(Kurtosis)[S3] 057-09. 분포 통계량 - 왜도/비대칭도(Skewness)가 교재에 없습니다.그리고 [S3] 057 Quiz 강의는 어디에 있나요? 강의 계속 듣다보니 교재에 [S3] 058-05. 도 없는데,,,,, 자료 업데이트가 안된건가요?
-
해결됨빅데이터 파이프라인 마스터; 성공을 위한 도구와 기술
섹션2 가상환경 설치 오류
안녕하세요. 섹션2 실습 진행 중 가상환경 설치 부분부터 막히고 있어 문의드립니다ㅠㅠ 다른 질문들 찾아보고 virtualbox 우분투 환경에서 진행 중입니다. python3 설치 방법, pip 설치 방법을 따로 안내해주시지 않아서 구글링 해서 진행했는데, 자꾸 오류가 나네요.우분투 버전이 24.04.01 입니다. 버전 차이에서 오는 오류일까요? 오류 내용을 보고 구글링해봐도 해결이 어려워 도움 요청합니다ㅠㅠ
-
해결됨데이터분석 준전문가(ADsP) 자격증 대비
[S1] 018-01. 개인 정보 비식별화 기법
데이터마스킹도 잡음 추가가 있고, 잡음 첨가도 잡음을 추가한다는 설명이 있는데, 어떻게 다른건가요? 잡음 첨가 기법은 예시가 없어서 더 차이가 구분이 안되는 것 같습니다.
-
해결됨데이터분석 준전문가(ADsP) 자격증 대비
[S1] 010 Quiz. 문제8
분야별 기업 내부 데이터베이스 솔루션 Quiz 13:41 교재에서는 insight, optimization, forecast가 BA(Business Analytics)의 키워드라고 했는데, 이 문제에서는 해당 키워드가 빅데이터 분석 관련 키워드라고 합니다. 그렇다면 BA(Business Analytics)가 빅데이터 분석을 의미하거나 포함하나요?
-
미해결15일간의 빅데이터 파일럿 프로젝트
프론터 여부
아직 수업 듣기전인데 이 프로젝트에 프론트도 포함되어 있나요? 결과물을 화면과 연계해서 보고 싶습니다
-
미해결15일간의 빅데이터 파일럿 프로젝트
안녕하세요, 강사님
안녕하세요, 강사님강의를 들으며 꾸준히 배우고 성장하고 싶었는데, 예상치 못한 일정들로 인해 충분히 강의를 소화하지 못한 점이 아쉬움으로 남습니다.현재 수강 기간이 얼마 남지 않아, 남은 강의를 보다 충실히 학습할 수 있도록 수강 기간 연장을 요청드려봅니다..
-
미해결[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
강의 일시정지 문의 드립니다
안녕하세요 이번 9회차 실기 시험을 봤는데.. 합격을 하지 못했습니다ㅜㅜ내년 상반기에 10회 실기 시험을 다시 응시하려고하는데.. 강의가 4월2일에 만료라서..혹시나 3개월정도 일시정지 가능할까요?내년 시험기간쯔음에 다시 공부해서 꼭합격 하고 싶어요ㅜㅜㅜㅜ 다른 문의글 보니 메일주소를 남겨달라는 답변을 모아서 남깁니다메일주소는 topk49@naver.com 입니다ㅜㅜ
-
해결됨[2025년 최신 기출 반영] 빅데이터 분석 기사 실기 시험 100% 합격 ! 기출 문제의 패턴이 보인다 !
교통사고 유형별 검거율 계산하고, 각 연도별로 최고 검거율과 사고유형에 대해서
교통사고 유형별 검거율 계산하고, 각 연도별로 최고 검거율과 사고유형에 대해서 궁금한 것이 있어요.최고 검거율과 관련해서 데이터가2018년 음주운전 발생 9102019년 음주운전 발생 11322020년 음주운전 발생 24132018년 음주운전 검거 8192019년 음주운전 검거 19492020년 음주운전 검거 4064라고 되어 있는데.. 발생보다 검거가 더 많이 나오는건 데이터를 램던으로 발생시켜서 그런걸로 이해하면 될까요 ?그리고 발생연도마다 최고 검거율을 뽑아내는데, 다른 컬럼이 분명 검거율이 높은데(예를 들어 1.xxx) 이를 보지 않고 특정 컬럼이 검거율이 높다고 설명을 주시니, 혼돈이 있습니다. 무슨 말인지 영상을 두번 돌려봐도 이해가 안되네요.. 데이터에 맞게 설명을 주시는건지, 아니면 기출에 맞게 주시는건지.. 2018년도 검거율이 가장 높은게 신호위반 0.79 라고 말씀을 주시는데, 같은 라인에 검거율이 가장 높은게 화물차사고 16.411 이라고 보여지는데. 어떻게 해석해야하나요 ?
-
해결됨실리콘밸리 엔지니어에게 배우는 파이썬 아파치 스파크
cdc 기반의 스트리밍 데이터 처리
안녕하세요. 강의 잘듣고 있는 도중에 질문이 있어 글을 작성하게 되었습니다. 현재 cdc 기반으로 iceberg 테이블에 operation(insert, update, delete) 정보들을 적용해서 데이터를 적재하고 있습니다. 이부분까지는 DMS -> kinesis -> lambda-> firehose -> iceberg 순서로 문제없이 적재를 진행하고 있지만 이런형식으로 운영중인 iceberg 테이블 10개를 join 시켜 datamart에 현재는 1주일에 한번씩 전체를 삭제 후 insert하는 비효율 적인 방식으로 마트를 운영중에 있습니다. 이것을 개선시키기 위해 적재중인 iceberg 테이블들에 변경된 데이터들을 5분 10분 단위로 종합해 datamart 테이블에 변경 분에 한해서만 insert, update, delete를 반영해주고자 하는데 강의를 듣다보니 spark streaming을 활용해서 뭔가 해결을 할 수 있을것 같은데 혹시 이부분에 대한 아이디어에 대해서 조언을 구할 수 있을까요? 10개의 테이블에 대해서 10분간 발생한 변경 점들을 종합해 datamart에 반영을 해주려고 하는데 아직 제대로 감이 잡히지 않아서 질문드렸습니다.
-
해결됨실리콘밸리 엔지니어에게 배우는 파이썬 아파치 스파크
broadcast 코드 예시 관련 질문
안녕하세요.broadcast 예제코드에서는 이미 aggregation된 dataframe(코드에서 interviwer_count)에 대해서 udf 실행을 위해서 meta 딕셔너리를 broadcast한 다음에 udf를 실행하는 것으로 이해하였는데요.실제 운영하는 상황에서는 이런 경우에는 이미 aggregation이 된 dataframe이 먼저 만들어질 것이기 때문에 meta 딕셔너리를 dataframe으로 만든 후 join하는 것과 큰 차이가 없지 않나요?해당 코드에서 broadcast를 함으로써 다른 방법(join 등)에 비해 얻는 이점이 어떤 건지 궁금합니다.
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
corr()이 작동하지 않는 문제
안녕하세요. 먼저 좋은 강의 감사드립니다.저는 이번 9회 시험에서 1유형 30점, 2유형 40점, 3유형 20점 총 90점으로 합격했습니다. 퇴근후딴짓 선생님의 좋은 강의 덕분이라고 생각합니다. 다만 시험 중에 이상한 일이 있었습니다.이번 3유형에 상관계수를 구하는 문제가 있었는데요, 제가 시험장에서 corr() 메서드를 사용했을 때 작동하지 않았습니다.자료형이 틀렸거나 옵션 문제 등의 오류가 아니라, 확실히 not defined로 기억합니다. corr() 메서드 호출 자체가 불가능했습니다. 몹시 당황해서 이런저런 라이브러리를 불러도 보고, dir, help 등도 시도해봤지만 호출 자체가 안 되니 할 수 있는 방법이 없더라고요.마지막으로 통계학 지식을 동원해 수작업 계산을 시도했지만, 결국 시간 부족으로 corr()이 필요했던 두 문제를(각 5점) 틀리게 되었습니다. 혹시 이런 문제가 발생하는 경우에 대해 아시는 바가 있을까요?합격과는 별개로 너무 궁금하고 답답해서 문의를 드립니다.
-
미해결[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
합격 소식과 함께 궁금한 점 문의드립니다.
선생님 안녕하세요. 우선 오늘 최종 합격하여 소식을 전하게 되었습니다.다만, 다름이 아니라 점수가 좀 턱걸이인지라.. 담주에 예정된 최종 결과에서 합격예정이 불합격으로 바뀌는 사례가 있는지 궁금합니다. 제가 알기로는 불합격 사례에서 합격 한 사례는 있는 것으로 아는데 반대 사례가 있는지요??우선 정말 감사드립니다. 큰 도움이 되었습니다.
-
미해결[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
수강 연장 문의
선생님 안녕하세요!이번 9회 시험을 55점으로 떨어지게 되어서.. 내년 6월에 있는 10회 시험을 응시하려고 합니다 ㅠㅠ그런데 만료 기간이 내년 5월까지라, 한 달 정도 강의를 일시정지하거나 다음 회차 시험 때까지 강의를 연장할 수 있을까요?
-
미해결[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
강사님 감사드립니다.
금일 빅분기 실기 가체점 결과가 올라와서 확인했는데...합격했습니다. 1교시가 너무 어렵게 나와서 힘들었었는데...강사님이 시험전에 2교시->3교시->1교시 순으로 준비를 하라는 글을 보고 많이 도움이 됐습니다. 덕분에 2차시험 2번째에 합격해서 감사드립니다. 회사일 때문에 강사님이 올려주신강의와 모의고사 풀이를 4번이상 반복해서 풀어본거, 마이드 맵을 기반으로 리마인드 해본 것이 많이 도움 됐습니다. 감사합니다.~~
-
미해결실리콘밸리 엔지니어에게 배우는 파이썬 아파치 스파크
재생에 문제가 생겼어요 라는 메세지가 자꾸 뜨네요
질문은 많으시면 많을수록 좋습니다. 가능한 빠른 답변 드리겠습니다.원활한 답변을 위해, 자세한 질문 사항 부탁드려요 :D
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
5-2type2.ipynb 질문 (작업형2 모의문제2)
강의 에서 예측진행시 선형회귀 랏소 릿지의 경우model= 하고 뒤에 해당 모델을 작성했는데18분 22초 랜덤포레스트의 경우 regressor =RandomForestRegressor()로 정의해 놓고밑에 학습은 model.fit으로 하고 pred도 model.fit으로 했는데 그럼 위에 있는 라쏘를 가지고 모델링을 한게 아닌가 궁금합니다.※요약 1: 랜덤포레스트에는 모델로 안하고 왜 regressor = 으로해서 진행했는가,요약2: model.fit으로 진행했는데, import를 랜덤포레스트로 했음에도 , 랜덤포레스트가 아닌 위에 model을 정의한 라쏘로 학습이 된것 아닌가이렇게 궁금합니다!!
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
2유형 test_size 질문드립니다
안녕하세요 저번 달에 실기시험 보고 온 수강생입니다. 평소에는 train_test_split에서 test_size를 0.2로 했는데시험장에서 무슨 바람이 분 건지 test_size를 0.1로 하고 왔습니다.이것 때문에 점수가 10점이 깎일 수도 있을까요?이외에는 랜덤포레스트 분류 모델 정석 코드 그대로 실행, 제출하고 왔습니다.2유형만 40점 나오면 넉넉하게 합격일 것 같은데 괜히 불안해지네요..
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
필기 과정을 다시 준비해야합니다..ㅠㅠ
직장을 다니면서 자격증 시험을 준비했는데, 하필 실기 시험날 타 지역 출장이 있어 응시를 하지 못했습니다..ㅠㅠ 일 하면서 틈틈히 강의 듣고 했는데 너무 아쉽네요 ㅎ 지금 필기 유효기간도 만료되어서 내년에 다시 준비를 해야하는데, 실기 강의가 내년 5월 만료더라구요 . 혹시 필기 대비하는 강좌나 25년 대비 강좌를 계획중이신게 있으실까요? 있다면 패키지로 묶어서 구매하고 싶은데, 기존 수강생 할인이나 쿠폰같은게 있으면 좋을 것 같아서요 .(양심이 없어 죄송합니다ㅠㅠ) 그리고 필기 공부하면서 실기를 같이 병행(실기강좌중 개념을 다루는 부분)하는게 좋은지도 궁금합니다!