30%
61,600원
다른 수강생들이 자주 물어보는 질문이 궁금하신가요?
- 미해결파이썬을 활용한 머신러닝 딥러닝 입문
DBSCAN 임의의 datapoint 생성 관련 질문
안녕하세요. 강의를 수강중인 학생입니다.DBSCAN 실습에서 총 1510개의 랜덤 datapoint를 만드는 과정에서 질문이 있어서 글을 작성합니다.X1, X2를 생성하는 방식은 이해가 되는데, X3과 X4를 생성하는 것에서 잘 이해가 되지 않습니다.X1과 X2를 생성할 시에는 KMeans에서 데이터를 만드는 방식과 동일하게 하였는데, 왜 갑자기 X3을 생성할 때에 저런 방식을 사용한 것인가요? 그리고 옆에 3과 +4는 무엇을 의미하는 것인가요? X4를 생성할 때에도 왜 3이 되어있는 건가요?추가로, DBSCAN 훈련 결과 나온 label에서 -1을 결과로 가진 datapoint는 무조건 outlier 취급인 것이 기본 설정인가요? 그렇다면, 0을 결과로 가지는 datapoint는 무엇을 의미하나요? 강의에 따르면 set을 통해 나올 수 있는 label을 확인한 결과 {-1, 0, 1, 2, 3, 4, 5}입니다.항상 자세하고 유익한 강의 감사드립니다.
- 미해결파이썬을 활용한 머신러닝 딥러닝 입문
데이터 크기에 대한 질문
안녕하세요. 좋은 강의 제공에 대해 감사드립니다.iris classification에 대해 데이터 크기에 대한 질문이 있어서 글을 작성합니다.앞서 KNN 알고리즘 설명 중 Data의 크기가 크면 slow하다는 단점이 있다고 하셨는데, test set과 pred set을 비교할 때는 data의 크기가 너무 작아서 파라미터만 건들여도 결과에 큰 변화가 있다고 말씀해주셨습니다.그렇다면, KNN을 사용할 때는 어차피 데이터의 크기가 작은 dataset만 사용할테니, 이 경우는 파라미터 조정을 통해서 예측의 정확도를 높여야 한다는 뜻인가요? (test_size의 조정, random_state의 조정, 가중치 제공 방식 변화 등) 그런데 이런 방식으로 정확도를 높이는 것 자체가 너무 결과에 끼워맞추기 위한 데이터 해석이라고 생각합니다. 이런 경우에는 파라미터를 조정하여 정확도를 높이는 것이 좋은 방식인지, 새로운 모델을 찾아보는 것이 좋은 방식인지 궁금합니다.또한, 알고리즘 설명에서 K값을 저희가 설정해야 한다고 하셨는데, 최적의 K값을 설정하는 방법에 대해 잘 이해가 안되서 질문 남깁니다.재미있고 유익한 강의 항상 감사드립니다!