작성
·
48
·
수정됨
0
학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!
질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요
먼저 유사한 질문이 있었는지 검색해보세요
작업형1 모의고사 풀어보기 6분 지점에서 cols 변수에 대해서도 단순한 임시 변수가 아닌 일부 조건을 담은 변수인 경우에는 구분해서 설명이 되면 좋겠어요.
적어도 자신이 임의로 만든 변수와 외부에서 일정 조건을 포함한 변수를 가져다 쓰는 경우에는 이를 구분해줄 필요가 있습니다. 아니 구분해줘야 한다고 생각을 합니다.
이게 결과값을 저장하기 위해 임시로 폴더명을 정한 건지, 이미 고정된 의미를 가진 파일 명을 포함하고 있는건지 구분을 못하면 개념을 이해 못하고 있는 것이 됩니다. 전자에 해당한다고 판단하여 cols 라는 이름을 따라서 쓰지 않고 임의로 바꿀 경우에는 학습자가 혼란스러워지겠죠.
답변 3
0
0
0
안녕하세요, 인프런 AI 인턴입니다. 강민균님.
강민균님께서 문의하신 내용과 유사한 질문과 답변을 찾을 수 있습니다. 빅데이터 분석 과정에서 cols
변수는 종종 수치형 데이터의 열 이름을 저장하기 위한 용도로 사용됩니다. 이는 모델링에서 특정 포맷이나 유형의 데이터만을 대상으로 처리하고자 할 때 필요하며, 특정 조건을 만족하는 열만을 작업에 포함하기 위한 불가피한 방안으로 활용됩니다.
작업형 2번이라는 질문에서는 train
데이터의 수치형 데이터 열(cols
)만을 사용한 이유가 있습니다. 수치형 데이터는 머신러닝 모델에서 필수적인 입력 값으로 사용되기 때문에, 수치형 데이터 열을 명확하게 구분하여 사용하는 것이 모델의 정확성에 중요할 수 있습니다. 예측 모델의 정확성을 높이기 위해 비수치형 데이터를 제외하고 수치형 데이터에 중점을 두는 경우가 많습니다.
다른 데이터형(예: 범주형 데이터)이 있을 경우, 특성 공학 기법을 통해 수치형 변수로 변환하는 과정을 더 거쳐야 할 수도 있습니다. 이러한 과정은 데이터 전처리의 핵심 부분이며, 원활한 모델링을 위해 데이터 타입별 적절한 처리가 필요합니다.
저는 질문자님의 이해를 돕고자 지식공유자님의 기존 답변을 참고하여 유사한 답변 링크를 추천해드리고 있습니다.
현재 베타 기능으로 답변이 만족스럽지 않을 수 있는 점 양해 부탁드립니다. 🙏
추가적으로 궁금한 점이 있으시면, 이어서 질문해 주세요. 곧 지식공유자께서 답변해 주실 것입니다.