빅데이터분석기사 실기시험 hist 사용 못하면 분포 확인을 쉽게 하는 방법 궁금합니다
빅데이터분석기사 실기시험 hist 사용이 가능한가요 ? 사용을 못하는 상황에서는 로그적용해볼만한 데이터 분포 확인 쉽게 하는 방법이 무엇이 있을지 궁금합니다
3-6 Regression노트북에서 insurance 데이터셋의 charges 값에 로그를 취하실 때 왼편으로 치우친 것을 확인하신 것 관련 질문입니다
LinearRegression은 모델에 random_state를 안 줘도 계속 5888 이라는 RMSE 값이 나오는 반면에, RandomForestRegressor의 경우, (아마도 모델에 random_state적용이 없어서) 결과가 계속 달라집니다. 혹시 LinearRegression은 원래 그런 특징이 있는 모델인가요??
답변 1
1
안녕하세요!! 아쉽지만 hist()등의 시각화 함수는 사용할 수 없는 환경입니다.
describe()를 보면 간단히는 볼 수 있지만 아무래도 어려움이 있을 것 같아요!
LinearRegression는 선형관계이며 X변수와 y변수 관계를 설명합니다. 선형모델은 random_state 하이퍼파라미터가 없습니다.
RandomForest, rightGBM, Xgboost Regressor는 트리 계열의 모델입니다. random_state가 필요합니다. 랜덤적인 요소가 있어요!
네 특징이 그런것 이 맞습니다.
응원하겠습니다 :)
평가결과값 문의
0
2
1
시계열 데이터 날짜와 시간 format
0
15
1
평가지표 F1 스코어 질문드립니다.
0
16
2
작업형 2 기출7회분에서
0
32
2
작업형2 모의문제1 (30강)
0
28
2
수강 기간 연장 문의 드립니다.
0
35
2
수강 계획과 관련해 문의 드립니다.
0
26
2
작업형1 - 연습문제 16~39 풀이는 몇강을 보면 되나요?
0
49
2
작업형 1 -연습문제 4-6
0
35
2
작업형 1 유형 부분
0
42
2
작업형 1 (삭제예정, 구 버전)
0
51
2
수강기간 연장 문의드립니다.
0
37
2
2유형 레이블 인코딩 VS 원핫 인코딩
0
37
3
수강기간 연장 문의드립니다.
0
44
2
인덱스 슬라이싱
0
36
2
질문 드립니다.
0
50
2
강의 내용 관련 질문드립니다~
0
46
2
수강 연장 문의
0
63
2
강의자료 일괄 다운로드
0
58
2
수강기간 연장 문의드립니다
0
48
2
list 문제 질문드립니다~
0
38
2
빅분기 실기 12회 재도전
0
63
2
강의 기간 연장 가능여부 검토 요청건
0
51
2
수강기간 연장 문의 드립니다
0
46
2





