소개
- 저서: 파이썬 딥러닝 텐서플로 (정보문화사)
- 유튜브: https://www.youtube.com/@ai-study
강의
전체1수강평
- 여러수업을 들어봤는데 가장 명쾌합니다. 감사합니다.
Kyewon(은서.후.채)
2024.01.15
1
게시글
질문&답변
2024.03.26
df[cond][Reached.on.Time_Y.N]의 의미가 궁금합니다.
이해하신 대로 df[cond][Reached.on.Time_Y.N]는 두 개의 대괄호 [] 명령문을 연결해서 사용한 것입니다. 처음 df[cond]는 cond 조건에 해당하는 행(row)들만 필터링해서 선택하는 역할을 합니다. 그 다음 df[cond] 뒤에 오는 [Reached.on.Time_Y.N]는 앞서 선택된 행들 중에서 Reached.on.Time_Y.N 컬럼의 값만 추출하는 역할을 합니다. 즉, df[cond][Reached.on.Time_Y.N]는 아래와 같이 두 단계로 이뤄진다고 보시면 됩니다. df[cond] : Discount > 10% 조건을 만족하는 행 선택 df[cond][Reached.on.Time_Y.N] : 1에서 선택된 행들의 Reached.on.Time_Y.N 컬럼값 선택 이렇게 대괄호를 연속으로 사용하는 체이닝(chaining) 방식은 판다스에서 자주 쓰이는 문법입니다. 코드를 간결하게 만들어주는 장점이 있어요.
- 0
- 1
- 43
질문&답변
2024.03.26
2회 작업형2 기출 데이터 관련
네, 원데이터는 1개가 맞습니다. 기출 2회 작업형2의 경우 노트북에 있는 # 시험환경 세팅 3개 파일 생성 셀을 실행하면 데이터가 생성됩니다:) 실행 해보고 안되면 댓글 주세요!! 응원합니다.
- 0
- 1
- 31
질문&답변
2024.03.25
왜 train 데이터만 fit_transform 하는지요?
레이블 인코딩을 예를 들어보면 fit -> 사전 만들기(학습 개념) transform -> 데이터 변경 fit_transform은 두 가지 작업을 진행해요! 데이터에 train데이터에 [사과, 포도, 딸기]가 있고, test에 [포도, 딸기]가 있다면 - fit을 통해 사과:0, 포도:1, 딸기:2 라고 사전을 만들고 - transform 으로 train(0, 1, 2)과 test(0, 2)데이터에 데이터를 변경하는 작업이 수행됩니다. 동일한 사전으로 적용하기 위해 test는 fit_transform을 하지 않아요! (해도 에러가 발생하지는 않습니다.) 스케일링도 동일해도 train 데이터로 계산한 부분을 test에 적용하기 위함이에요! 한 단계 더 들어가면 test데이터 정보 누수를 막을 수 있어요!
- 0
- 2
- 37
질문&답변
2024.03.21
왜 정확도가 다르게 나올까요?
환경에 따라 완전히 동일한 결과를 재현하긴 어려울 수 있습니다. 일반적인 모델 성능 평가에 큰차이가 나는 것이 아니라면 지장이 없습니다. 작업형2는 작업형1, 3과 달리 정답이 있는 문제가 아니라 모델 성능 평가 결과의 구간(기준 미공개)으로 채점하고 있어요!
- 0
- 1
- 48
질문&답변
2024.03.18
fit_transform함수 문의
fit_transform 함수는 두 가지 작업을 수행합니다: fit : 주어진 데이터를 기반으로 변환을 위한 기준 정보를 학습합니다. 예를 들어, StandardScaler 의 경우 데이터의 평균과 표준편차를 계산합니다. transform : 학습된 기준 정보를 바탕으로 실제로 데이터를 변환합니다. 예를 들어, StandardScaler 는 데이터에서 평균을 빼고 표준편차로 나누어 표준화를 수행합니다. fit_transform 함수는 이 두 가지 작업을 한 번에 수행합니다. 즉, 데이터를 기반으로 변환을 위한 기준 정보를 학습하고, 해당 정보를 사용하여 데이터를 변환한 결과를 반환합니다. 작업형2에서 데이터 전처리시 반복해서 사용할 예정이에요! 💪 💪 💪
- 0
- 1
- 36