인프런 커뮤니티 질문&답변
시험때 질문
작성
·
22
·
수정됨
답변 2
0
안녕하세요, 마소캠퍼스입니다.
우선 1유형 관련해서 주신 질문의 경우, 문제마다 다르다는 답변을 드려야 할 것 같습니다.
말 그대로 print한 값을 제출해야 하는 문제도 있고, 아닌 문제도 있기 때문입니다.
해당 부분은 문제의 요구 사항에 맞추어 수행하시면 될 것 같습니다.
3유형에서 summary를 보는 이유는 1유형보다는 본격적인 분석을 위해 데이터를 파악하는 차원에서 수행하는 것이므로, 1유형에서도 참고가 필요하시다면 사용하셔도 무방합니다.
2유형에서 문의 주신 파라미터 변경의 경우, 범주형 변수의 팩터 변환은 필수적으로 수행하시는 것을 추천드리며, XGBoost와 LightGBM 모델도 다룰 수 있다면 분명 유리하겠지만 랜덤포레스트 모델이 일반적으로 사용하기 쉽고 안정적이기 때문에 본 강의에서는 랜덤포레스트를 추천하고 있습니다.
채점 기준의 경우에도 문제마다 다르다 할 수 있으나, 2유형에서 csv를 제출하는 유형들의 경우 해당 데이터를 정답 데이터와 비교하여 채점이 진행된다 알려져 있으니 참고 부탁드립니다.
감사합니다.
마소캠퍼스 드림.
안녕하세요, 마소캠퍼스입니다.
먼저 열정적으로 학습에 임해 주심에 감사 인사를 드립니다.
말씀해 주신 것과 같이 일반적으로 베이스라인 모델 학습은 머신러닝 실무에서 좋은 습관이지만,
자격증 실기 시험의 경우 시간이 제한되어 있기 때문에 베이스라인 모델 학습을 수행하기 어려울 수 있습니다.
먼저 말씀드린 랜덤 포레스트를 추천드리는 이유 또한 여기에 있는데, 여러 장점 중에서도 이상치에 덜 민감한 점, 과적합이 자동으로 방지되는 점, 기본 하이퍼파라미터 상태로도 일정 이상의 성능이 확보되는 점 등이 베이스라인 모델 학습을 생략하기 좋기 때문입니다.
감사합니다.
마소캠퍼스 드림.
0
안녕하세요, 인프런 AI 인턴입니다. ej0681님.
빅데이터분석기사 실기 시험에서는 유형에 따라 요구되는 사항들이 다소 다를 수 있습니다. 이를 통해 각 유형이 요구하는 포맷과 내용을 잘 이해하고 준비하는 것이 중요합니다.
1유형 관련
1유형의 경우, 코드는 늘 결과를 명확하게 출력하는 것이 좋습니다. print() 함수 사용은 출력 결과를 검토하고 제출할 때 실수를 줄일 수 있는 방법 중 하나입니다. 하지만, 구체적으로 print 사용이 필수인지는 각 시험의 요구사항에 따라 다를 수 있으므로, 문제에서 요구하는 부분을 정확히 확인해 보세요.
3유형 관련
3유형의 경우에는 주로 분석적 결과를 사용하여 최종 답안을 작성하는 것이 중요합니다. summary() 함수의 사용은 분석한 데이터를 요약하고 이해하는 데 도움이 됩니다. 따라서 summary를 보고 원하는 정보를 추출하여 필요한 곳에 정확히 제시하는 것이 관건입니다.
2유형 관련
2유형에서는 파라미터 조정의 중요성에 대해 질문하셨네요. 실제 시험에서는 문제의 요구사항에 따라 파라미터를 조정하는 과정이 채점 기준에 포함될 수 있습니다. 시험 준비 시 다양한 파라미터 조정의 효과를 이해하고 그에 따라 최적의 모델을 도출하는 연습을 추천드립니다. 하지만 문제에서 특정한 틀이나 형식을 요구한다면, 그 요구사항을 우선적으로 따라야 합니다.
이와 관련된 구체적인 채점 기준이나 팁은 공식적인 시험 자료나 문제 설명을 통해 확인하는 것이 가장 정확합니다.
추가적으로 도움이 되는 유사한 질문에 대한 답변 링크를 추천해드리니 참고해주시기 바랍니다:
- 실기 시험에서 결과 출력을 위한 팁
- 시험 유형별 접근 방법
저는 질문자님의 이해를 돕고자 지식공유자님의 기존 답변을 참고하여 유사한 답변 링크를 추천해드리고 있습니다. 현재 베타 기능으로 답변이 만족스럽지 않을 수 있는 점 양해 부탁드립니다. 🙏
추가적으로 궁금한 점이 있으시면, 이어서 질문해 주세요. 곧 지식공유자께서 답변해 주실 것입니다.





친절한 답변 감사합니다! 혹시 2유형에서 베이스라인 모델 학습(lm)은 생략해도 괜찮은 부분일까요?