K-평균(실습#3) 결과 값이 왜 다르게 나올까요?
234
5 asked
random_state=0으로 결과값을 맞추면 강사님과 결과값이 동일해야하는데요. ㅠ
y_kmeans의 결과값이 다르게 나옵니다.
강사님 파일 받은거 돌려도 그러네요.
그래서 그런지 클러스터 네이밍 번호 순서도 다르게 나와요.
vscode, 주피터 모두 동일하게 나와서...
강사님과 같지 않아도 맞는거겠죠?ㅎㅎ
Answer 1
0
안녕하세요, 인프런 AI 인턴입니다.
따숩게님, K-평균 클러스터링에서 random_state=0을 설정하신 후 결과값이 달라지는 문제를 겪고 계시네요. random_state를 설정했음에도 불구하고 결과가 다르게 나올 수 있는 이유는 몇 가지가 있습니다.
강의에서 사용된 버전과 현재 사용하시는 라이브러리(예: sklearn)의 버전이 다를 경우 알고리즘의 세부 구현 방식에 차이가 있을 수 있습니다. 이로 인해 동일한 random_state 값을 사용해도 결과가 다르게 나올 수 있습니다.
데이터셋에 변경 사항이 있거나 다루는 방식에 차이가 있는 경우 다른 결과가 나올 수 있습니다. 예를 들어 강의에서 사용된 데이터셋의 전처리 과정과 현재 사용하는 데이터셋의 전처리 과정에 차이가 없는지 확인해보세요.
K-평균 알고리즘은 초기 클러스터 중심점의 선택에 영향을 받을 수 있으며, random_state로 동일한 초기값을 제공했더라도 다른 내부 요인으로 인해 결과가 달라질 수 있습니다.
클러스터 네이밍 번호 순서가 다른 것은 시각화나 나열 순서에 영향을 미칠 수 있지만, 클러스터링의 성능 자체에는 영향을 미치지 않습니다. 결과를 확인할 때는 클러스터링이 데이터를 어떻게 구분했는지, 도메인 지식과 비교하여 타당한지를 중점적으로 평가해야 합니다.
이러한 점들을 고려하여 현재의 결과값이 강의 내용과 다르더라도 본질적으로 올바른 클러스터링이 수행되었는지를 검토해보시길 권장드립니다. 추가적인 질문이 있으시다면 인프런의 ‘문의하기’ 기능을 통해 직접 문의해 보실 수도 있습니다.
또한, 동일한 문제로 고민하고 계시다면 인프런 커뮤니티에 질문글을 남겨보시거나, 질문이 많은 강의에 대한 Q&A 세션을 확인해 보실 수 있습니다. 더 도움이 필요하시면 언제든지 돌아오세요.
수강기간 연장 문의드립니다.
0
8
1
인덱스 슬라이싱
0
12
2
코드를 첨부해야하는 이유가 있나요?
0
14
2
소리가 겹쳐서 들려요
0
16
2
데스크톱과 노트북 연결
0
18
1
dict, zip
0
18
2
노션 : 파트3번 링크와 권한 , 파트4번 권한요청, 파트 5번도 미리 요청 드립니다.
0
24
4
6-6 실습 문의
0
20
2
미션 06-02
0
20
2
yes24 수집 md 파일 만들 때
0
18
2
python main.py 실행시 게임이 실행이 안돼요
0
21
2
antigravity 대신 cursor를 활용해도 되나요?
0
25
1
뉴스 검색 분류 한도초과
0
32
2
완성자료
0
22
2
섹션5 노션링크 는 따로 없나요?
0
24
2
필기자료 사라졌나요?(실기 일주일만에 안돼서 재도전-_-)
0
33
2
Part 4에서 강의 연관 노션 정보들이 워드파일에 없습니다.
0
31
2
첨부자료 Part 4 코드 확인 부탁드리겠습니다.
0
24
2
질문 드립니다.
0
41
2
머신러닝 - surprise 모듈 설치 오류
0
353
1
K-평균(실습#2) 의 fit, fit_transform 질문입니다.
0
421
1
다항회귀(실습#2)
0
269
1
선형 회귀
0
398
0
협업(리뷰 기반)필터링#1 질문
0
898
1

