인프런 커뮤니티 질문&답변
새로 추가된 라이브러리
작성
·
231
0
실기 4회 수정된 공지사항에서
R에 gbm, lightgbm 라이브러리가 추가되었다고 하는데,
기존 스크립트만 잘 익히면 따로 연습할 필요가 없는 라이브러리 인가요~?
시험을 위한 강의로서 선생님만한 강의가 없습니다.
감사하게 생각하며 열심히 공부하고 있습니다.
답변 1
1
companionclub
지식공유자
안녕하세요. 좋은 평가 너무나도 감사드립니다.
말씀하신 두 개의 라이브러리는 모두 부스팅계열의 알고리즘을 담은 라이브러리입니다.
잘 아시는대로 부스팅계열의 알고리즘은 캐글이나 많은 경진대회에서 정형데이터 기준으로
높은 성능을 보여주고 있어서 많은 분석가들이 사용하는 알고리즘입니다.
그래서 아마도 진흥원쪽에 계속 요청을 했고 추가된 것으로 보입니다.
그러나 부스팅계열의 알고리즘은 1) 파라미터튜닝이 필요 2) 적은 데이터셋에 과적합 발생 등의
문제를 가지고 있습니다. 파라미터튜닝을 잘하고 많은 데이터셋이라면 높은성능을 내지만
그렇지 않은 경우에는 오히려 과적합의 문제가 발생하거나 코드실행에 많은 시간이 소요됩니다.
다른 알고리즘에 비해 상대적인 얘기겠지만요.
따라서 시험환경인 1) 실행시간 1분 제한 2) 적은 데이터셋에는 적합하지 않다고 생각합니다.
물론 강의의 전략대로 어느정도의 성능만 확보하면되기 때문에 사실 어떤 알고리즘을 사용하더라도
비슷한 수준의 모델성능이 나와서 비슷한 점수를 얻어갈 것으로 보입니다.
만약에 부스팅 계열의 알고리즘 활용이 손에 익으셨다면 위의 라이브러리를 사용하시는 것도
좋은 방법일 수 있습니다. 그러나 새로 익혀야 되는 상황이라면 추천드리지는 않습니다.
그럼 좋은 하루되세요!






친절한 답변 감사합니다.
이번주 시험 잘 치고 오겠습니다~!