SMOTE를 활용한 데이터 생성
안녕하세요? 강의 잘 듣고 있습니다.
다름이 아니라, SMOTE를 활용하여 데이터를 생성하는 과정에서
저의 데이터는 강의에서 보여지는 것과 달라서 질문 드립니다.

이렇게 선형데이터로 생성되어도 0,1을 구분하기 위하여 러닝을 하는데에 영향을 미치지는 않을까요?
제 코드내용은 링크로 공유드립니다.
감사합니다.
Answer 1
0
무도사님,
작성하신 코드의 시각화 부분을 보니
X1, X2 = x_pca[y==1,0], x_pca[y==1,0] 으로 작성하셨습니다. 그렇게 되면 X_pca 의 첫번째 성분만 plot하므로 선형으로 그려지게 됩니다. 코드를 교재와 같이
X1, X2 = X_pca[y_over == 1, 0], X_pca[y_over == 1, 1] 로 수정 바랍니다.
X1, X2 = x_pca[y==1,0], x_pca[y==1,0]
plt.scatter(X1,X2, color=cmap(1), label=1)
===> 다음과 같이 수정
X1, X2 = X_pca[y_over == 1, 0], X_pca[y_over == 1, 1]
plt.scatter(X1,X2, color=cmap(1), label=1)
RandomForest vs lgb
0
12
1
전처리 관련질문
0
7
2
작업형3 기출
0
7
1
유형2에서 데이터분할 생략 가능여부
0
14
2
9회 기출 유형3 질문
0
10
1
lgb 기초편
0
8
1
수업자료 문의
0
12
2
괄호 사용
0
12
1
작업형 2 데이터 전처리 질문
0
14
1
11회 기출 유형 작업형1 문제 3-1
0
10
0
예시문제 작업형2 (ver2023) 질문입니다
0
12
1
Data type에 따른 처리
0
12
2
Cursor 실행 문의
1
12
2
데이터 전처리 관련
0
14
2
시험에서 문제 불러오기
0
12
2
2번문제 출력값 질문
0
18
2
오토인코더+ Knn, SVC 로 해석하는경우
0
67
3
VAE 모델 loss 계산하는 부분 오류
0
271
2
features 수가 작을 경우의 Dense 설정 문의
0
236
1
라이브러리 임포트 시 경고 메세지가 뜹니다.
0
578
1
오토인코더를 특성 추출기로 사용하는 방법에 대해 질문
0
263
1
실습: 001. Imbalanced Dataset Sampling 관련 질문
0
1185
2
깃헙의 자료와 강의의 실습 내용이 다릅니다.
0
274
1
섹션2. DNN 이진분류 part2에서 pos, neg에 대해 질문드립니다.
0
574
1


