• 카테고리

    질문 & 답변
  • 세부 분야

    딥러닝 · 머신러닝

  • 해결 여부

    미해결

모델 코드 질문

21.10.14 02:24 작성 조회수 231

0

안녕하세요 강사님! 강의 매우 잘들은 학생입니다.

제가 다른 데이터를 이용해서 간단히 regression하는 코드를 작성해보았습니다.

이렇게 작성하였는데 예측을 해보면 예측 값 정확도가 매우 떨어집니다.(해당 row의 실제값은 24입니다.)

그래서 쉬운 style로 모델을 작성해보았습니다.

예측을 해보니 비교적 예측 정확도가 높습니다.(24에 가깝습니다.)

제가 보기에는 두 모델 코드를 작성한 스타일만 다르고 모두 같다고 생각되는데 왜 예측값이 많이 다른지 모르겠습니다..

데이터를 받아온 과정은 아래와 같습니다.

 

 

답변 1

답변을 작성해보세요.

0

안녕하세요~. 반갑습니다.

코드상에 큰 차이는 없어보이는데요. 차이가 발생할 수 있는 가능성은 다음과 같은 부분들이 예상됩니다.

1.  beginner style에서는 bias를 1로 초기화하고 expert style에서는 bias를 0으로 초기화한 것이 다른 점 같습니다.

2. 올려주신 코드로 보면 따로 batch를 나누지 않고 전체 데이터를 이용해서 실행하신 것 같은데 beginner style에서 fit 함수를 호출할때 batch_size를 따로 지정해주지 않으면 beginner style에서는 batch_size=32로 32개의 batch 단위로 묶어서 자동으로 mini-batch gradient를 수행하게 됩니다. 반대로 expert style에서는 명시적으로 배치를 나눠서 학습시키지 않고 데이터를 다 넣어주면 batch gradient descent를 수행하게 됩니다. 이 부분에서 차이가 발생할 수도 있습니다.

좋은 하루되세요~.

감사합니다.