Kỳ thi thực hành kỹ thuật viên phân tích dữ liệu lớn (Python)
Đây là bài giảng về Kỹ thuật viên phân tích dữ liệu lớn cấp chứng chỉ công nghệ quốc gia với Python. Chúng tôi cổ vũ cho sự thành công của bạn!

- Chưa giải quyết
구름IDE 서비스 종료 이후 학습환경
안녕하세요.본 강의의 연습문제 풀이가 구름IDE 환경에서 진행되고 있는데, 해당 서비스가 25년 10월 30일을 마지막으로 더 이상 지원하지 않는 것으로 보입니다.이후 해당 강의 내용을 학습하기 위해서는
python빅데이터hyunfelee8188
・
4 tháng trước
0
88
1
- Chưa giải quyết
10강 연습문제
1) X_train, X_test, y_train, y_test = train_test_split (df.iloc[:, 1:], df['survived'], test_size = 0.2, random_state = 42, strati
python빅데이터전처리skduddlcjs3086
・
0
161
1
- Chưa giải quyết
VotingClassifier Hard 사용
Hard VotingClassifier 을 사용하면 여러 모델이 내놓은 예측값 중에 가장 많이 득표 한 값을 최종 예측값으로 내놓는다는 것으로 이해하고 있는데요, 2개의 모델
python빅데이터votingclassifierskduddlcjs3086
・
0
105
1
- Chưa giải quyết
구름IDE 실행 도움 요청
<img src="https://cdn.inflearn.com/public/files/posts/e84bf163-0679-4db7-9598-05c667fa1a83/187ad3ab-877d-4345-8793-dd577b27b5cb.png" media-type="img"
python빅데이터jisoo0u0kim5917
・
0
154
1
- Chưa giải quyết
질문입니다 RandomForestClassifier
RandomForestClassifier만 적용하여 앙상블 학습하였을때 ROC_AUC_SCORE가 1.0이 나오는데,, 연습문제 동영상과 같이 0.84.... 가 나오지 않고 1.0이 나오는 이유가 뭘까요 혹시 과적합이라면 오답이
python빅데이터moter2588
・
0
163
1
- Chưa giải quyết
질문!
더미화를 해주는데 라벨인코딩을 같이하는 이유가 무엇인가요?
python빅데이터Không có tác giả
・
0
337
1
- Chưa giải quyết
데이터 더미화 에러발생 질문.
<img src="https://cdn.inf
python빅데이터sja37905752
・
0
307
1
- Chưa giải quyết
많은 컬럼과 많은 결측치를 가지는 데이터
많은 컬럼과 많은 결측치를 가지는 컬럼(ex. 10개)이 많은 데이터에 경우에는 강의에서 나오는 방식으로 하게되면 많이 복잡해지는 거 같습니다. 다른 좋은 방법이 뭐가 있을까요?
python빅데이터Không có tác giả
・
0
196
1
- Chưa giải quyết
Dataset은 어디서 받을 수 있나요?
Dataset은 어디서 받을 수 있나요?
python빅데이터Không có tác giả
・
0
388
1
- Chưa giải quyết
mpg 데이터셋 위치
데이터 셋 중 'mpg'는 파일이 어디에 있나요? 다른건 검색하면 깃헙에 나오던데
python빅데이터info0953
・
0
332
1
- Chưa giải quyết
교육영상 4강. 작업유형1-문제(1)에 대한 코드는 어디서 받을 수 있나요?
교육영상 4강. 작업유형1-문제(1)에 대한 코드는 어디서 받을 수 있나요? car_crashes라는 dataset을 불러오도록 코드가 짜져있는데 해당 샘플파일은 어디서 받을 수 있는건지요..?
python빅데이터dhguseo5844
・
0
368
1
- Chưa giải quyết
단순평균(1집단)T-test 1번 풀이
1번에서 "(치료 후 혈압-치료 전 혈압)의 평균" 이기 때문에강의에 설명해 주신 a['bp_after'].mean() 이 아니고(a['bp_after']-a['bp_before']).mean().round(2) 여야 맞지 않나 싶은데..
python빅데이터dkrnahs9168229
・
0
470
2
- Chưa giải quyết
강의자료 문의
매 강의 초반에 나오는 화면자료는 강의에 따로 안올려주신거죠?
python빅데이터ksp1003079
・
1
544
1
- Chưa giải quyết
구름IDE 실행불가문제 ㅠㅠ
밑줄 부분이 계속 나오고
python빅데이터leejken530
・
0
795
2
- Chưa giải quyết
제7강 작업유형2-데이터 전처리: LabelEncoder 문법
from sklearn.preprocessing import LabelEncoder label=['species','island','sex'] enc=LabelEncoder() df[label]=df[label].apply
python빅데이터baesj967575
・
0
438
1
- Chưa giải quyết
5강 작업유형1-문제 2 질문입니다
마지막 전처리 전후의 표준편차값을 출력할때 제가 혼자 했을때는print(df['distance'].std())print(df_af['distance'].std())로 하였는데 출력결과275.2191532793011
python빅데이터skdbswjd163441
・
0
402
1
- Chưa giải quyết
7강 코드 질문드립니다
7강 코드를 replit에 따라쳐보고 있는데요ㅠㅠ 두가지 질문이 있습니다1) get_dummies 관련 강의에서 선생님께서는 get_dummies에서 df 만 인자로 넣으셨는데저는 그렇게 하니까 숫자처럼 보이는 컬
python빅데이터6688
・
0
408
1
- Chưa giải quyết
14강 실전 문제 카테고리 항목문의
주구매지점 카테고리화 할때 for문을 써야하는 이유가 있나요??? for문 안쓰고 하기와 같이 했을때 문제되는게 있는지요?X_train['주구매지점'] = X_train['주구매지점'].astype('category')X_te
python빅데이터heroin84604
・
0
392
1
- Chưa giải quyết
작업2유형 문의
안녕하세요 선생님~유튜브로 강의 수강한 학생입니다.인프런에 강의 수록되어있는 것 확인 후 문의글 남깁니다.선생님께서 알려주신대로 코드 작성하면서 궁금했던 점 3가지가 있습니다.빅데이터분석기사 실기 응
pythonbigdataKhông có tác giả
・
0
455
1
- Chưa giải quyết
데이터셋 분리와 관련하여 질문이 있습니다.
안녕하세요. 빅분기 실기 준비 중인 수강생입니다.먼저 감사하다는 말씀 드립니다. 많은 도움이 되고 있습니다.수강 중에 궁금한 사항이 있어 질문 드립니다.10강. 연습문제 풀이에서 먼저 X_train, X_test 데이터셋으로
bigdatapythonnyohnav0030
・
0
436
1

