inflearn logo
강의

강의

N
챌린지

챌린지

멘토링

멘토링

N
클립

클립

로드맵

로드맵

지식공유

[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

[작업형2] 연습문제 섹션 3

작업형 2 연습문제 섹션 3

해결된 질문

22

벤프

작성한 질문수 2

0

python 머신러닝 빅데이터 pandas 빅데이터분석기사 데이터인코딩 모델학습

답변 2

0

퇴근후딴짓

  1. 시험 환경에서는 서버가 좀 더 쾌적합니다. 체험 환경 시간과 1:1은 아니었어요!

  2. 1분이 넘어가지 않는다면 무조건 rmse는 낮은 모델을 선택해야죠. 따라서 랜포를 선택!

  3. 네 맞습니다. 동일하게 슬라이싱 가능합니다.


0

인프런 AI 인턴

안녕하세요, 인프런 AI 인턴입니다. 벤프님, 질문 주셔서 감사합니다.

질문에 대해 말씀드리면, 가장 먼저 데이터 인코딩과 관련해 칼럼 개수와 모델 학습 시간에 대해 다루어보겠습니다.

1. 칼럼 수와 모델 학습 시간

  • 칼럼 수 1267개: 보통 수십 개에서 수백 개 정도의 칼럼을 가진 데이터셋은 무거운 편은 아니지만, 칼럼 수가 많아질수록 학습 시간이 증가하고 과적합(overfitting) 우려가 생길 수 있습니다. 특히, 랜덤포레스트는 많은 트리를 생성해 복잡한 모델을 만들기 때문에 칼럼 수가 많아지면 학습 시간이 길어질 수 있습니다.

  • 모델 학습 시간: 시험 환경에서는 인터넷 속도나 CPU 성능 등 환경적 요소에 따라 차이가 발생할 수 있습니다. 일반적으로 랜덤포레스트보다 LightGBM이 빠르게 학습되므로, 시험 환경에서는 오랜 시간이 걸리지 않도록 LightGBM을 선택하는 것이 실용적일 수 있습니다.

2. 모델 선택 기준

  • 성능과 시간: 랜덤포레스트가 더 좋은 성능을 보이지만 학습에 시간이 오래 걸리는 경우라면, 시간 제약 하에서는 LightGBM과 같은 빠른 모델을 사용할 수도 있습니다. 이는 모델의 복잡성에 따른 trade-off로, 성능과 시간을 모두 고려해야 합니다.

3. df.iloc vs df[:len(train)]

  • 결과의 동일성: df.iloc[:len(train)]df[:len(train)] 의 차이는 데이터프레임의 슬라이스 결과가 동일하다는 점입니다. iloc를 사용하지 않고 인덱싱을 할 수 있습니다만, iloc를 사용하면 명시적으로 행렬 인덱싱을 표현하고, apple-표준화된 방법을 유지할 수 있습니다.

유사한 주제에 대한 추가 설명을 찾으실 수 있는 링크는 다음과 같습니다:

저는 질문자님의 이해를 돕고자 지식공유자님의 기존 답변을 참고하여 유사한 답변 링크를 추천해드리고 있습니다.
현재 베타 기능으로 답변이 만족스럽지 않을 수 있는 점 양해 부탁드립니다. 🙏
추가적으로 궁금한 점이 있으시면, 이어서 질문해 주세요. 곧 지식공유자께서 답변해 주실 것입니다.

예측값 결과 소수점 차이

0

12

2

기출 문제와 실전챌린지 연습문제 무엇부터 푸는게 나은가요?

0

9

0

전처리 train() test([ ])

0

10

2

작업형 1 배경지식 질문

0

13

2

옳게 풀은건지 질문드립니다!

0

11

1

roc_auc_score

0

19

2

추가질문 합니다

0

13

2

시험환경 구름

0

14

2

2유형 질문드려요

0

11

2

RandomForest vs lgb

0

21

2

전처리 관련질문

0

20

3

작업형3 기출

0

15

2

유형2에서 데이터분할 생략 가능여부

0

25

2

9회 기출 유형3 질문

0

15

1

lgb 기초편

0

12

1

괄호 사용

0

18

1

작업형 2 데이터 전처리 질문

0

20

1

11회 기출 유형 작업형1 문제 3-1

0

16

0

예시문제 작업형2 (ver2023) 질문입니다

0

17

1

Data type에 따른 처리

0

18

2

데이터 전처리 관련

0

17

2

시험에서 문제 불러오기

0

18

2

2번문제 출력값 질문

0

24

2

pd.get_dummies()가 bool로 반환

0

19

2