• 카테고리

    질문 & 답변
  • 세부 분야

    데이터 분석

  • 해결 여부

    미해결

작업2유형 분류문제

22.06.29 09:30 작성 조회수 291

0

 

안녕하세요, 이번 빅분기 4회 시험 응시한 수강생입니다.

본 강의 덕분에 기초를 잘 다지고 시험에 응시할 수 있었습니다. 감사합니다.

다만 매 시험마다 문제가 계속 업그레이드 되고 있는 것 같습니다. 이전 2~3회 기출문제 공부만으로는 비전공자들은 합격하지 못할 것 같습니다..

저 역시 작업2유형에서 4가지로 분류하는 문제를 보고 많이 당황하여 시험 시간에 많이 헤맸네요ㅠㅠ 어찌저찌 rpart만으로 결과를 산출해서 제출했는데, 1 / 2 / 3 / 4  class중에서 2 class로는 분류되는 케이스가 하나도 없더라고요. 변수 몇 가지를 수작업으로 뺐다 더했다 해봤으나 안 되더라고요.. 작업2유형에서 전처리를 뭘 안 한건지. 혹시 표준화/정규화 같은 걸 하지 않아서 그런건지 모르겠네요. (분명 주어진 train 데이터에는 4개 class 모두에 케이스가 분포되어 있음)

무튼 다음 시험을 준비하기 위해서 이번 실기 4회 기출문제 풀이강의도 추가해주시면 좋겠습니다. 가능하시다면 출제 예상되는 범위를 좀더 넓힌 강의도 추가해주시면 계속 공부하는데 큰 도움이 될 것 같습니다(4개 class 분류, 날짜 데이터 처리 등).

감사합니다!

답변 2

·

답변을 작성해보세요.

2

 

안녕하세요. 

 

네. 말씀주신 부분과 같이 저도 이번시험을 보면서 많이 당황스러웠는데요.

2,3회와 전혀다른 유형의 문제들이 출제되었습니다.

아무리 시험초기라고 하지만 문제의 난이도나 출제범위가 너무 달랐다고 판단됩니다.

 

지금까지 올려둔 강의는 2,3회에 최적화되어서 올려둔 강의인데요.

이번 4회차 리뷰를 하면서 몇 가지를 더 울려둘 계획입니다.

원래 강의의 목적자체가 R이나 데이터분석을 하고자하는 것은 아니고 최소한의 노력으로

시험을 통과하는데 목적이 있기 때문에 광범위한 내용을 다루지는 않겠지만

최소한 4회때 이슈가 된 부분들에 대해서는 한두달내에 업데이트 할예정입니다.

 

지적해주신 부분 잘 염두해두겠습니다. 감사합니다.

허종덕님의 프로필

허종덕

2022.08.31

이번엔 파이썬으로 도전을 헸는데, multi-classification과 날짜, 소숫점처리, ML에서 답안과 동일한 양식을 제출하는 부분에 모호한 점이 있었습니다. 3회에서는 R로 제출을 했으나, ML 결과 양식과 맞지 않아 zero점으로 채점되어 재 채점을 주장했으나 무산되었구요, 4회는 Python으로 도전했는데, 전처리에 너무 많은 시간의 낭비와 학습범위를 잘못으로 재 도전이 필요합니다. 파이썬이 좋은 듯 하나, R의 장점이 있으니 2개를 동시에 같은 방법으로 고민하면서 학습이 필요할 듯 생각합니다. 회사에서 프로젝트시는 그래프 분석을 통한 탐색적도구, 딥러닝이 많은데, 시대에 뒤떨어진 머신러닝 학습에 국한된 점도 시간 투자를 꺼리게 하는 듯 합니다. 선생님께서 많은 것 일깨워 주심에도 기대에 못미쳐 실망시켜드려 송구합니다. 늦게 합격되면 진짜 실력가가 될 것 같네요. 다양한 공부를 할 수 있어서...

0

R과 Python의 양자택일 문제는 참 어려운 것 같습니다. 단지 언어의 특성뿐아니라 학습자의 배경, 회사에 구축된 시스템등 너무 많은 것에 영향을 받습니다. 다만, 개인적으로 단지 시험을 합격하는 용도라면 Python보다 R이 유리하다고 생각합니다.

제 경험상 생각보다 회사의 문제들이 머신러닝, 딥러닝이 아닌 SQL을 활용한 데이터추출, 시각화툴을 이용한 대시보드 제작으로 풀리는경우가 많은 것 같습니다.

물론 이거도 회사의 업이나 프로덕트의 종류에 따라 천차만별이라고 생각합니다.

이번회차에는 부디 합격을 기원드립니다. 이미 충분한 실력을 가지고 계신데 운의 때가 맞지 않았나봅니다.

좋은결과 있으실겁니다!!