묻고 답해요
164만명의 커뮤니티!! 함께 토론해봐요.
인프런 TOP Writers
-
미해결[개정판] 파이썬 머신러닝 완벽 가이드
범주형 변수 클러스터링
안녕하십니까 교수님 군집화에서 질문이 있어 글을 남기게 되었습니다. 군집화는 거리를 기반하여 유사도를 측정하는 머신러닝 기법이라고 배웠습니다,그럼 카테고리컬 변수의 경우 어떤식으로 클러스터링을 할 수 있을까요?구글링을 해 보니 k-modes라는 것이 있던데.. 연속형 변수와 범주형 변수 데이터를 모두 고려한 클러스터링 방법이 있을까요? 항상 감사합니다.
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
삭제 예정 강의(섹션17) 질문 및 공부 방향
안녕하세요~지난 6회 실기 떨어지고.. ㅜㅜ 이번에 7회 재도전하는 수험생입니다~ 여러 유튜브 강의를 들어보았으나 퇴근후딴짓님 강의가 제일 저랑 잘맞는것 같아서 인프런에서 수강하고 있습니다. 강의를 계속 듣다 보니 추가적으로 업데이트 되는 강의도 많고 섹션 17(3유형)은 곧 삭제 예정이라고 하는데 섹션17은 꼭 볼 필요는 없는건가요? 아직 초반 듣고 있어서요.. 다음은 공부 방향에 대한 질문입니다..지난 6회는 3유형이 신설되었고 비전공자 직장인이라 충분한 연습을 못하고 갔습니다. 1유형은 하필 datetime 변환 문제가 시험장에서 기억이 안나서 2문제 날려버렸고.. 2유형은 베이스라인 외워서 전처리부터 모델링까지 다했음에도 10점 나오더군요.. ㅠㅠ 3유형은 유튜브에 여러 무료 강의와 데이터진흥원의 샘플 문제를 여러 차례 연습했음에도 달랑 1문제 맞은 것 같아요..많은 좌절감을 느끼며 이번에는 최대한 잘 준비해서 꼭 합격하고 싶습니다. 이번 퇴근후딴짓 커리큘럼만 잘 이해하고 숙지하면 충분할까요? 긍정의 에너지와 격려 말씀부탁드립니다~
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
데이터 전처리시 궁금점!
데이터 전처리시 범주형(object)이면 라벨 or 원핫 인코딩수치형(int or float) 이면 민맥스스켈러 or z스켈러인데 타겟값이 범주형인가 수치형인가에 따라 전처리 방법을 다르게 하는건가요 아니면타겟값과 상관 없이 문자형, 수치형 둘다 해보는건지 또는 문자형 or 수치형 중에 아무거나 해도상관없는건지 궁금합니다! 또 어떠한 경우에 라벨, 원핫, 민맥스스켈러, z스켈러를 사용하는지도 궁금합니다! ex) 작업형2번 모의문제 1번에서는 타겟 값이 수치형 이지만 전처리시 민맥스스켈러 혹은 z스켈러를 이용하지 않고 문자형컬럼을 제거하거나 라벨, 원한 인코딩을 한 이유가 있을까요?타겟값이 범주형이기 때문에 그런건가요..ㅠㅠ파이썬이 처음이라 개념이 잘 안잡혀 있어서 헷갈리네요 ㅜㅜ
-
미해결[개정판] 파이썬 머신러닝 완벽 가이드
교차 검증 시에 계수나 규칙이 계속 바뀌는건가요?
안녕하세요 교차검증에 대해 잘 이해가 안되서요 ㅠㅠ만약 3번 교차검증을 한다했을 때첫번째 학습을 하고 나서 두번째 학습시에 첫번째 모델을 기반으로 분류라면 분류규칙이라든지 회귀라면 회귀계수가 변경이 된고 셋번째 학습시에 두번째 모델을 기반으로 변경이 계속 되는건가요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
데이터프레임을 객체로 저장하거나, csv로 내보내기/불러오기를 할 때 record들의 순서
df.to_csv('data2.csv', index=False)를 할 때 인덱스를 제외하고 저장을 한다면, to_csv 후 이를 다시 read_csv를 해서 불러왔을 때 데이터프레임 내의 record들의 순서는 바뀌지 않고 고정인가요? SQL을 사용할 때는 Select를 할 때 record의 순서는 계속 바뀌던데 판다스에서는 특별히 조작을 하지 않는 이상 record들의 순서는 바뀌지 않는 것으로 이해하면 될까요?
-
해결됨비전공자를 위한 진짜 입문 올인원 개발 부트캠프
Fly.io 에 그랩마켓 서버 배포하기 수업 중 오류 발생
docker 관련 에러인것 같습니다.docker 관련 파트 언제 했는지 찾을 수가 없어서 수업 다시 들어 보면서 해결하지도 못하네요어떻게 손대야 할 지 모르겠습니다.
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
3유형 업데이트 혹시 언제 될 예정이실까요?
3유형 업데이트 강의 대략 몇월 언제정도에 출시될 계획이신지 공유해주시면 매우 도움이 될 것 같습니다 ㅠㅠ 그리고 기존 버전의 3유형 강의만 충실히 소화해도 시험 합격하는 데에는 무리가 없는지도 궁금합니다. 감사합니다!
-
미해결[개정판] 파이썬 머신러닝 완벽 가이드
gridsearchcv관련 간단한 질문이 있습니다.
안녕하십니까, 많이 배우고 있습니다.질문 : GridSearchCV의 경우 k-fold만 사용 하는 것 같은데, stratified k-fold는 사용할 수 없나요? 아래는 chat gpt가 stratified k-fold 사용법을 알려줬는데 아래와 같이 사용하면 되는지 여쭙습니다. from sklearn.model_selection import StratifiedKFold, GridSearchCV from sklearn.svm import SVC # 예제 데이터와 모델 X, y = load_your_data() # 데이터를 로드하거나 생성하는 코드 model = SVC() # 사용할 모델 # Stratified K-Fold 교차 검증 설정 stratified_kfold = StratifiedKFold(n_splits=5, shuffle=True, random_state=42) # 그리드 서치 설정 param_grid = { 'C': [0.1, 1, 10], 'kernel': ['linear', 'rbf'] } grid_search = GridSearchCV(estimator=model, param_grid=param_grid, cv=stratified_kfold) # 그리드 서치 수행 grid_search.fit(X, y) # 최적의 매개변수와 결과 출력 print("Best parameters found: ", grid_search.best_params_) print("Best cross-validation score: {:.2f}".format(grid_search.best_score_)) 위 코드에서는 StratifiedKFold를 GridSearchCV의 cv 매개변수에 전달하여 Stratified K-Fold 교차 검증을 수행하고 있습니다. 따라서 그리드 서치는 Stratified K-Fold 교차 검증을 사용하여 모델의 성능을 평가합니다. StratifiedKFold의 n_splits 매개변수는 원하는 폴드 수를 지정할 수 있습니다.이렇게 하면 그리드 서치를 Stratified K-Fold 교차 검증과 함께 사용하여 클래스 간 분포를 고려한 모델 평가를 수행할 수 있습니다.
-
미해결[개정판] 파이썬 머신러닝 완벽 가이드
uci human activity recognition dataset 에 대한 내용
강사님 안녕하세요! 이제 막 강의를 듣기 시작한 학생입니다. 다름이 아니라 Human Activity Recognition Using Smartphones - UCI Machine Learning Repository이 사이트가 바뀌어서 dataset를 어디서 다운 받을지 모르겠습니다 어디로 가야할지 알려주실 수 있나요 ?
-
미해결비전공자를 위한 진짜 입문 올인원 개발 부트캠프
for반복문 안에 for반복문으로 배열 요소 뽑기
인강 한바퀴 다 듣고 이제 제 개인 프로젝트를 하나 해보고싶어 다시 들으면서 조금 변형시키면서 만드는 중입니다.객체 안에 배열을 하나 넣어뒀는데, 그것을 반복문으로 배열의 요소 만큼 태그를 생성시키고 싶어 이중for문을 사용했는데, characters의 다음요소가 들어가버려서 모양이 이상하게 됩니다.... 이렇게는 아예 못쓰는건가요?character-tag에 css를 설정해두어 없애면 안됩니다.사진이 넘치는건 overflow: hidden을 안했습니다.
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
7회 준비 실기 영상 관련
항상 좋은 강의 감사드립니다 :)3유형 업데이트 일정을 알고 싶어 남겼습니다.감사합니다!
-
미해결[개정판] 딥러닝 컴퓨터 비전 완벽 가이드
강의에서 소개된 모델중 현 프로젝트에 가장 어울리는 모델
안녕하세요 강사님. 정말 좋은 강의 감사합니다. 현재 Fast R-CNN 까지의 학습을 완료한 상태입니다.친절하고 꼼꼼한 설명덕분에, AI 에 완전히 입문입에도 불구하고 이해가 잘 되며 강의를 따라가고 있습니다.학교 프로젝트에서 AI 역할을 맡으면서 이 강의를 수강하게 되었습니다. 제가 아예 AI 쪽에 문외한이었다보니, 강사님께서 소개해주시는 모델중에서 어떤 것을 선택해야하는지 감이 잡히지 않습니다. 최종 선택은 저의 몫이긴 하나, 강사님께서 고견을 실례를 무릅쓰고 여쭤보고 싶습니다.저희 프로젝트에서 AI 의 역할은 다음과 같습니다.1. 웹캠 또는 웹카메라를 이용하여 식물을 촬영 (실시간은 아니어도 되고, 하루에 한번은 촬영을 해야합니다.)2. 해당 사진 / 영상을 통해 다음과 같은 정보를 식별 i) 잡초 여부 ii) 병충해 여부 iii) 과일이 있다면, 과일의 익은 정도 (상했는가 YES/NO 로 classfication 도 괜찮습니다.) iv) 얼만큼 자랐는가 - iv) 는 필수이고 i)~iii) 중에선 하나 정도 진행하고자 합니다.이를 수행하기 위해선 어떤 모델을 선택하는게 좋을까요? 그리고 해당 AI 서버를 구축하기 위해선 어떤 다른 지식들이 필요한지 키워드 정도만 알려주시면 정말 감사하겠습니다. (키워드만 알려주시면 나머지 학습은 제가 하겠습니다.)
-
해결됨[개정판] 파이썬 머신러닝 완벽 가이드
GridSearchCV 질문 드립니다!
GridSearchCV의 best_score_ method를 이용하면 교차검증을 통해 최적의 하이퍼파라미터 조합을 찾아서 가장 높은 score를 반환하는 것으로 알고 있습니다. 다만 여기서 scoring 하이퍼파라미터 설정을 안한다면 반환되는 best_score_는 무엇이 되는건가요? accuracy가 디폴트인가요? best_score_floatMean cross-validated score of the best_estimatorFor multi-metric evaluation, this is present only if refit is specified.This attribute is not available if refit is a function. 공식문서에서는 이렇게 나오는데, 여기에서도 score를 어떻게 정의하는지에 대해 구체적으로 나와있지 않았습니다. GridSearchCV를 사용하는데 있어서, 디폴트로 반환하는 .best_score_값이 무엇인지 정확히 무엇인지 궁금합니다! 긴 글 읽어주셔서 감사합니다 :) 오늘도 좋은 하루 보내시길 바랍니다!
-
미해결딥러닝 CNN 완벽 가이드 - TFKeras 버전
섹션 8. keras sequence 기반의 dataset 관련 질문입니다.
안녕하세요 교수님!keras sequence 기반 dataset에서 label을 one-hot encoding을 해주는 과정에서,pd.get_dummies와 pd.factorize를 소개해주셨는데.. 만약 강의에서와 달리 pd.factorize로 인코딩하지 않고, pd.get_dummies로 인코딩했다면 모델 생성 부분에서 마지막 layer에output = Dense(2, activation='softmax')(x)로 바꿔준다면 동일한 로직인 것이 맞겠죠..? 또 다른 질문으로는, 이진 분류라면 아무래도 softmax 보다는 sigmoid를 사용하는 편이 더 나은 것인지 궁금합니다! (혹시 성능적으로 더 좋을까요...?)좋은 강의 정말 감사합니다!!
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
가설검정과정
가설 검정 과정 강의에서 가설검정 오류 부분에 일반적으로 1종 오류를 2종 오류보다 더 중요하게 생각함 이라고 적혀있습니다.강사님 강의 내용에서는 2종이 더 심각하게 받아들여진다 라고 말씀주셨는데,두 개 중 어떤 부분이 맞는건가요?
-
미해결유니티 머신러닝 에이전트 완전정복 (기초편)
GridWorld, CollectObservations에서 에러 질문입니다.
비슷한 주제로 네번째 글을 올리게 되었습니다. -.-;매번 답변에 항상 감사드립니다.몇몇 실수를 교정한 현재의 현상을 나열해 드립니다. 책 및 github의 스크립트를 따랐을 때(1) 실행 코드 (2)에러 화면동영상 강의 내용을 따랐을 때(1) 실행코드(2) 에러화면null==sensor 를 null!=sensor로 교정하였을 때(답변해주신 글 도움 받음)(1) 실행코드(2) 에러 화면 ※ observation size (6)와 observation size (2)의 인식이 문제인 것 같습니다. 도움 부탁드립니다.
-
미해결[리뉴얼] 처음하는 파이썬 머신러닝 부트캠프 (쉽게! 실제 캐글 문제 풀며 정리하기) [데이터분석/과학 Part2]
강의자료 문의
머신러닝 배경지식: 머신러닝 모델과 성능평가의 이해의 설명해주시는 마크다운 파일(01-RECOGNITION.md)은 학습자료에 미포함인가요?시간될 때 마다 읽어보고 싶어서 문의드립니다!
-
해결됨[개정판] 파이썬 머신러닝 완벽 가이드
random_state에 관해 질문드립니다
일반적으로 train_test_split() 함수에 random_state를 지정하는 이유는 학습 데이터셋과 테스트 데이터셋을 분리할 때 매 수행마다 동일한 데이터셋으로 분리하기 위함이라고 알고 있습니다. 그런데 DecisionTreeClassifier()객체를 생성할 때 안에 random_state를 넣어주는 이유는 무엇인가요? DeicisonTreeClassifier과 train_test_split() 둘다 random_state를 넣어줘야 하나요? 만약 그렇다면 radom_state가 각각 사용되는 의미가 다른가요? 다르다면 어떻게 다른지 여쭙고 싶습니다. 선생님, 날씨도 더운데 답변해주시느라 너무 감사합니다ㅜㅜ
-
해결됨유니티 머신러닝 에이전트 완전정복 (기초편)
yaml을 이용한 GAIL 및 BC를 mlagents-learn으로 실행 시 에러
python API 를 이용한 BC는 무사히 잘 작동합니다.재밌네요. ㅎㅎ현재는 제목처럼, yaml에 GAIL 및 BC를 설정해서, 유니티의 mlagents-learn으로 실행하는 하는 것을 시도하고 있습니다.Kart.exe 의 창이 뜨고 잘 진행되는 듯하다가 다음과 같이 커맨트창에 에러를 내놓고 꺼집니다.저의 yaml 파일 내용을 다음과 같습니다.
-
미해결딥러닝 CNN 완벽 가이드 - TFKeras 버전
사전 훈련 모델 VGG16을 이용하여 CIFAR10 학습 모델 구현 성능
CIFAR10_Pretrained_01에서 성능이 매우 낮게 나와서 공유된 코드 복붙도 해보고 껐다 켜보기도 했지만 결과가 이상합니다. 뭐가 문제일까요?