강의

멘토링

로드맵

Inflearn brand logo image

인프런 커뮤니티 질문&답변

이선희님의 프로필 이미지
이선희

작성한 질문수

[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

2회 기출유형(작업형2)

작업형2 이 문제는 데이터가 3개 주어졌다고 치고 풀어보는건가요?

해결된 질문

작성

·

48

0

다른 문제들에서는 train과 test데이터 두개만 주어진채로 계속 들은거같은데 이 문제는 주어진 데이터가 3개인건지..

제가 앞서 이해했던 문제들의 데이터는

train데이터를 가지고 분할하고 모델링을 한후 validation한 데이터로 pred값을 구하고 실제값과 비교해서 지표로 매겨본후에 최종 test데이터를 넣어서 csv파일로 만드는 순서인데..

 

지금 이 문제처럼 데이터가 3개인것은 어떤 차이가있는 것일까요 ㅠㅠ

 

답변 2

0

퇴근후딴짓님의 프로필 이미지
퇴근후딴짓
지식공유자

"치고"는 아니구요~

실제로 기출 2유형은 3개의 데이터가 출제되었습니다 🙂

타겟이 분리된 형태인데 지금은 이런식으로 제공하고 있지 않아요!

0

안녕하세요, 인프런 AI 인턴입니다. 이선희님께서 질문하신 내용은 데이터 분석에서 여러 번 다루어지는 중요한 주제입니다. 데이터가 2개 주어질 때와 3개 주어질 때의 차이점에 대해 이해를 돕고자 기존의 유사한 질문과 답변 내용을 공유드리겠습니다.

데이터가 2개 주어졌을 때는 일반적으로 traintest 데이터로 구성되어 있습니다. train 데이터를 사용하여 모델을 학습시키고, test 데이터를 통해 그 모델의 성능을 평가합니다. 이 과정에서 검증을 위해 train 데이터를 X_train, y_train, X_val, y_val로 나누기도 합니다.

반면, 데이터가 3개(X_train, y_train, X_test) 주어질 경우에는 X_trainy_train을 결합하여 모델 학습에 사용하고, X_test를 통해 최종 예측 결과를 얻는 게 일반적입니다.

이와 관련하여 좀 더 구체적인 답변은 다음 링크에서 확인하실 수 있습니다:

  1. “작업형2 데이터 주어지는 개수에 따라” - 데이터가 2개일 때와 3개일 때의 차이점을 설명한 답변입니다.
  2. “작업형2 모의문제 2 질문있습니다!” - train과 test 데이터를 분리하거나 합치는 방식 등 다양한 처리 방법에 대한 내용이 포함되어 있습니다.

지현님께서 이해하신 바와 같이, 데이터가 3개일 경우, X_trainy_train을 합쳐 모델을 학습시킨 후, X_test를 예측하는 방식으로 진행하시면 됩니다. 또한, 여러 변수 처리(예: 인코딩, 스케일링 등) 방법에 대한 연습도 필요합니다.

저는 질문자님의 이해를 돕고자 지식공유자님의 기존 답변을 참고하여 유사한 답변 링크를 추천해드리고 있습니다.
현재 베타 기능으로 답변이 만족스럽지 않을 수 있는 점 양해 부탁드립니다. 🙏
추가적으로 궁금한 점이 있으시면, 이어서 질문해 주세요. 곧 지식공유자께서 답변해 주실 것입니다.

이선희님의 프로필 이미지
이선희

작성한 질문수

질문하기