csv 개수 차이

Question

안녕하세요. 강의에서 csv 2, 3개 차이가 있다고 하셨는데, 어떤 차이와 코드를 작성하는데 어떤 차이가 있는지 문의드립니다. 감사합니다.

퇴근후딴짓 · Answer

3개는 train 타겟 컬럼이 분리된 형태로 제공되었어요

퇴근후딴짓 · Answer

2개로만 준비하시면 됩니다 🙂 초기에 3개로 나왔는데 이번에 변경된 예시도 2개라서 3개가 나올 가능성은 매우 희박해요!

인프런 AI 인턴 · Answer

안녕하세요, 인프런 AI 인턴입니다. Gab Kkk님. CSV 파일의 개수 차이는 일반적으로 데이터의 구성이나 훈련/테스트 집합의 나누는 방법 등에 의해 발생할 수 있습니다. 강의에서 언급된 &lsquo;csv 2, 3개 차이&rsquo;란 훈련 데이터와 테스트 데이터로 파일을 나눌 때, 혹은 추가적으로 검증(validation) 데이터셋을 나눌 때 발생하는 파일 수 차이를 뜻할 수 있습니다. 데이터 구성 방식 : 모델을 훈련하고 평가하는 과정에서 데이터를 여러 개의 CSV 파일로 나누어 사용하는 경우, 훈련 데이터(train), 테스트 데이터(test), 검증 데이터(validation)가 각각의 CSV 파일로 관리되기도 합니다. 데이터 전처리 : 파일이 여러 개인 경우 동일한 전처리 과정을 각 파일에 적용해야 하며, 파일 개수가 많아졌을 때, 각 데이터의 처리 및 로드, 변환 과정에서의 코드 차이가 발생합니다. 코딩의 차이 : 코드의 차이는 데이터 로딩과 초기화 부분에서 주로 발생합니다. 각각의 데이터셋에 대해 pd.read_csv() 등을 사용하여 데이터를 로드하고 이를 바탕으로 전처리 및 분석을 수행하게 됩니다. 구체적인 차이와 코드 변경 사항은 데이터 구조 및 문제 해결 방식에 따라 달라질 수 있으며, 이를 실습하며 배우게 됩니다. 관련하여 유사한 주제를 다루는 질문들을 살펴보시면 도움이 될 것입니다. 예를 들어, 여러 CSV 파일을 하나로 합치는 방법이나, 개별적으로 관리하는 방법을 논의하는 게시물들이 참고할 만한 유용한 정보가 될 것입니다. 이해에 도움이 필요하시다면 아래 링크들을 참고하세요: - 파이썬 데이터 핸들링 관련 배우기 : 데이터 핸들링에서 여러 CSV 파일을 다루는 방법에 대한 조언이 포함된 기존 게시물들을 참고해 보시면 좋습니다. - 판다스 활용법 : 판다스를 활용하여 데이터 프레임을 나누고 결합하는 방법에 대한 다양한 방법이 논의됩니다. 저는 질문자님의 이해를 돕고자 지식공유자님의 기존 답변을 참고하여 유사한 답변 링크를 추천해드리고 있습니다. 현재 베타 기능으로 답변이 만족스럽지 않을 수 있는 점 양해 부탁드립니다. 🙏 추가적으로 궁금한 점이 있으시면, 이어서 질문해 주세요. 곧 지식공유자께서 답변해 주실 것입니다.