3회 기출유형(작업형2) 수치형 데이터와 범주형 데이터 분리 관련 질문입니다.
안녕하세요~ 선생님~
드디어 강의를 다 듣고 시험 준비를 하기 위해 기출문제와 강의 내용을 다시 한 번 반복하고 있습니다.
그러던 중에 3회 기출유형(작업형2)에서 수치형 데이터와 범주형 데이터 분리를 위해 select_dtypes() 요 메소드를 쓰고 나서 다시 copy()를 하는 것에 대해 궁금해서 여쭙게 되었습니다.
copy() 메소드를 더 붙이는 데에는 이유가 있을까요?
강의를 듣고 코드들을 숙지하면서 준비하니까 정말 강의 선택 잘 했다는 확인이 듭니다. 물론 붙는 건 또 별개의 문제겠지만… 아마 또 질문을 드리겠지만, 강의 정말 잘 들었다는 말씀 드립니다. ㅎ
답변 1
1
copy()를 작성하는 이유는 사본이라는 것을 분명하게 하기 위함이에요!!
작성하지 않아도 작동되다가 갑자기
SettingWithCopyWarning라는 워닝이 발생하기도 합니다.
일반적으로 워닝은 무시하나 시험환경은 실행이 중단되었습니다라는 멘트가 떠서
안전하게 워닝을 발생하는 것을 막는 것이 중요할 것 같아요
따라서 데이터프레임을 새 변수에 복사하거나 슬라이싱 등을 할 때는 뒤에 copy()를 붙여서 사본임을 알려주세요!! ( 혹시 컴공이라면...추가적으로 값에 의한 참조와 주소의 의한 참조랑 비슷합니다. )
그리고 데이터 분리 없이 아래와 같이 작성해요 자동으로 object컬럼만 원핫 인코딩하니 참고해 주세요!
train = pd.get_dummies(train)
test = pd.get_dummies(test)
1유형 강의 다 나간 후 어떻게 할까요?
0
14
1
점수차가 많이 나는데 따로 하신게 있으신가요?
0
10
1
작업형1 모의문제 4번에 3)문제 질문
0
21
2
이상치 전처리 작업
0
25
2
평가결과값 문의
0
29
2
시계열 데이터 날짜와 시간 format
0
35
2
평가지표 F1 스코어 질문드립니다.
0
27
2
작업형 2 기출7회분에서
0
38
2
작업형2 모의문제1 (30강)
0
34
2
수강 기간 연장 문의 드립니다.
0
42
2
수강 계획과 관련해 문의 드립니다.
0
30
2
작업형1 - 연습문제 16~39 풀이는 몇강을 보면 되나요?
0
50
2
작업형 1 -연습문제 4-6
0
38
2
작업형 1 유형 부분
0
42
2
작업형 1 (삭제예정, 구 버전)
0
51
2
수강기간 연장 문의드립니다.
0
38
2
2유형 레이블 인코딩 VS 원핫 인코딩
0
37
3
수강기간 연장 문의드립니다.
0
44
2
인덱스 슬라이싱
0
37
2
질문 드립니다.
0
50
2
강의 내용 관련 질문드립니다~
0
46
2
수강 연장 문의
0
63
2
강의자료 일괄 다운로드
0
62
2
수강기간 연장 문의드립니다
0
48
2





