• 카테고리

    질문 & 답변
  • 세부 분야

    데이터 분석

  • 해결 여부

    미해결

강사님 정말 궁금한게 있습니다.

20.02.16 21:10 작성 조회수 107

0

[텐서플로2][프로젝트 2] Multi Variable 완주기록 예측 모델

202[Tensorflow2]MultiVariableMatrixLinearRegression.py

여기서 사용하고있는 결과값을, 첨부한 이미지로  결과값이 나오는게 아닌 Name , 즉 사람을 기준으로 결과값을 한번 내보고 싶은데요. 이 질문을 드리는 이유는 2015~2017년도 데이터를 보니 중복으로 뛴사람들도 많이 있는 것으로 확인을 했습니다.

이 강의를 수강한 이유는 강의내용의 소스코드를 살짝 변경하여 나중에 제가 따로 구현을 해볼때에는,

데이터 구성을 동일한 사람이 여러 대회를 뛰었다는 전체하에 데이터를 A라는 사람의 풀코스기록데이터 20개, B라는 사람의 풀코스 기록데이터 20개 등등  100여명 정도의 데이터를 이런식으로 넣고 사람(Name)값을 기준으로 하여 아웃풋(결과값)을 내어보고자 합니다.

ex)

Name    gender            age     Pace      Record_Prediction(Second) at 42.195km

홍길동           Male           40      500          03:38:16

이렇게 결과값을 내어보고자 하는데 어떻게 코드을 변경해야할까요 ???

바쁘신 와중에 미리 감사의 말씀을 드립니다.

답변 2

·

답변을 작성해보세요.

0

강사님 답변 감사합니다 말씀해주신 강의를 기준으로 참고하여 제작해보겠습니다! 궁금한거 있으면 또 질문남기겠습니다.

답변 남겨주셔서 진심으로 감사합니다.

0

안녕하십니까?

열심히 공부하고 계시네요.

질문하신 내용을 제가 이해한 바로는

기술적으로 사람을 기준으로 그룹을 만들 수 있으나 통계적으로 의미가 있나하는 생각이듭니다.

일단 2015~2017년도 데이터만 보면 같은 사람이 중복 참여해도 최대 3회이고 다른 대회를 포함해서 모수가 많아져도 말씀하신데로 20회정도가 최대일것 같습니다. 그리고 마라톤 특성 상 대회코스마다 기록변화가 다르게 나타납니다. 예를 들어 보스톤 마라톤 코스에는 32km지점에 Heartbreak hill 지점이 언덕으로 되어 기록저하가 심하다는 군요. 물론 참가자 신체 특성상 구간마다 특성이 있겠지만 통계모수가 적을 것 같습니다.

제가 이해하기로는 시티헌터님이 사람의 이름을 넣으면 구간별 예상 기록을 확인하고 싶으신 것으로 생각이되는데 그렇다면 

'[프로젝트 1] 마라톤 남은기록 예측 모델 만들기'를 응용하시는 것이 좋을 듯 합니다. 일단 이 모델을 사용하기 전에  Pandas 로 2015~2017년도 데이터를 이름으로 평균을 내시어 모델에서 사용하시는 것이 어떨까요?

도움이 되길 바라며 추가적인 질문이 잇으면 언제나 알려주세요.

감사합니다.