인프런 커뮤니티 질문&답변
작업형 2유형 질문 드려요..
작성
·
23
0
학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!
질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요
먼저 유사한 질문이 있었는지 검색해보세요
이번 시험 작업형2에서 범주형 변수가 없어서 원핫인코딩을 진행하지 않았는데 자료형을 보면 int랑 float가 있는데 모든 변수를 int로 바꿔줬어야 했나요...?
다들 평가지표를 보면 0.6..., 0.7... 이런식으로 나오셨는데 저는 0.06..., 0.07.. 이렇게 나왔거든요..
혹시 작업형2 점수는 0점처리가 될까요???
답변 2
0
안녕하세요, 인프런 AI 인턴입니다. 보리과자님.
작업형2 유형에 대한 질문을 주셨네요. 범주형 변수 인코딩의 필요성과 결과 평가에 대해 설명드리겠습니다.
범주형 변수 및 자료형 변환: 작업형 문제에서 범주형 변수가 없다고 하셨는데, 이는 여러분의 데이터셋의 특성에 따라 달라질 수 있습니다. 일반적으로 원핫인코딩은 범주형 변수에 대해 적용합니다. 하지만 전처리 단계에서 수치형 데이터와 범주형 데이터를 구분하여 적절한 전처리 과정을 거치는 것이 중요합니다. 모든 변수를 int로 변환하는 것보다, 데이터가 실수(float)형으로 주어진 경우 그 형태를 유지하면서 필요한 전처리를 하는 것이 좋습니다.
모델 성능 및 점수 평가: 평가지표에서 매우 낮은 점수(0.06, 0.07)가 나왔다는 것은 모델이 데이터를 잘 학습하지 못했거나, 예측이 목표에 맞지 않았다는 것을 의미할 수 있습니다. 전처리 과정이나 모델 선택, 파라미터 설정 등에서 변화가 필요할 수 있습니다. 시험에서 점수가 정확히 어떻게 반영되는지는 시험 주최측의 기준에 따라 다를 수 있지만, 이러한 점수를 가진 경우 개선의 여지가 있다고 볼 수 있습니다.
가능한 향후 시도에서는 데이터를 더 잘 이해하고 적절한 인코딩과 모델링을 하도록 노력해보면 좋습니다.
유사한 사례에 대해 설명된 게시물들도 함께 확인해보시면 도움이 될 수 있습니다. 참고해 보실 수 있는 링크는 다음과 같습니다:
저는 질문자님의 이해를 돕고자 지식공유자님의 기존 답변을 참고하여 유사한 답변 링크를 추천해드리고 있습니다.
현재 베타 기능으로 답변이 만족스럽지 않을 수 있는 점 양해 부탁드립니다. 🙏
추가적으로 궁금한 점이 있으시면, 이어서 질문해 주세요. 곧 지식공유자께서 답변해 주실 것입니다.






#데이터전처리
target = train.pop('target변수‘)
#검증데이터나누기
from sklearn.model_selection import train_test_split
X_tr, X_val, y_tr, y_val = train_test_split(train, target, test_size=0.2, random_state=0)
#머신러닝 학습 및 평가
from sklearn.ensemble import RandomForsetClassifier
from sklearn.metrics import f1_score
#랜덤포레스트
rf = RandomForestClassifier(random_state=0)
rf.fit(X_tr, y_tr)
pred = rf.predict(X_val)
print(f1_score(y_val, pred, average='macro'))
#랜덤포레스트
import lightgbm as lgb
lg = lgb.LGBMClassifier(random_state=0, verbose=-1)
lg.fit(X_tr, y_tr)
pred = lg.predict(X_val)
print(f1_score(y_val, pred, average='macro'))
#최종결과제출
pred = lg.predict(test)
result = pd.DataFrame({'pred':pred})
read.to_csv('result.csv', index=False)
pd.read_csv('result.csv')
이렇게 제출했습니다....