묻고 답해요
164만명의 커뮤니티!! 함께 토론해봐요.
인프런 TOP Writers
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
성능 수치에 관한 질문
작업형2 모의문제1 27:08초 안녕하세요. 모델의 성능 수치가 0.989404816...이었다가 0.98997073,,,으로 좀 더 좋아졌다고 하셨는데요..문돌이인 제가 보기에는 그냥 다 같은 98%로밖에 안보기든요..ㅠ 98.94%든 98.97%든 그게..시험에서 큰 영향이 있는건가요?ㅠ 시험에서 저런 미세한 차이가 작업형 2번 문제를 40점을 받느냐, 0점을 받느냐를 좌우하는건가요?시험문제 조건에서 'roc-auc 80% 이상일 것'이라고 적혀있으면 98.94%든 98.97%든 모두 40점을 주는게 아닌가요?즉..98.94%면 35점이고, 98.97%는 40점인건가요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
범주형변수를 포함한 다중선형회귀 모델에서 독립변수 사용 방식
강의 중 ols함수를 ols('매출액 ~ 광고비 + 유형_A + 유형_C', data=df2).fit() 이런식으로 범주형 변수의 일부 컬럼만 사용해서 회귀모델을 구축할 수 있다고 하셨습니다.그래서 테스트를 해 본 결과 위와 같이 유형_A와 유형_C를 회귀모델의 독립변수로 활용하기 위해서는df = pd.get_dummies(df, drop_first=True)이런식으로 다중공선성 방지를 위한 파라미터를 추가하는게 아니라 위 캡처본에서의 df2와 같이 전체 변수가 포함된 데이터프레임을(유형_A, 유형_B, 유형_C 가 전부 포함된 데이터프레임) 사용해야 하는 것을 알았습니다. 근데, 이렇게 df2와 유형_A, 유형_C를 활용한 회귀모델은 유형_B를 감안한 것이 아니라 그냥 유형_B만 갑자기 누락해버린 회귀모델이 아닐지 문의드립니다. import pandas as pd df = pd.DataFrame({ '매출액' : [300, 320, 250, 360, 315, 328, 310, 335, 326, 280, 290, 300, 315, 328, 310, 335, 300, 400, 500, 600] , '광고비': [70, 75, 30, 80, 72, 77, 70, 82, 70, 80, 68, 90, 72, 77, 70, 82, 40, 20, 75, 80] , '플랫폼': [15, 16, 14, 20, 19, 17, 16, 19, 15, 20, 14, 5, 16, 17, 16, 14, 30, 40, 10, 50] , '투자':[100, 0, 200, 0, 10, 0, 5, 0, 20, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0] , '유형':['B','B','C','A','B','B','B','B','B','B' ,'C','B','B','B','B','B','B','A','A','A'] }) df = pd.get_dummies(df, drop_first=True) from statsmodels.formula.api import ols model = ols('매출액 ~ 광고비 + 유형_B + 유형_C', data=df).fit() print(model.summary()) 위에서는 엄연히 유형_A도 감안된 것일텐데 이런 상황에서 유형_A를 회귀모델 독립변수로 쓰지 않은 것과는 (매출액 ~ 광고비 + 유형_B + 유형_C) 다른 결인 것 같아서요!
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
대응표본검정 실습문제 중 심화문제
제공해주신 쥬피터노트북에서 귀무가설의 부등호 방향이 반대인 것 같은데 혹시 맞을까요?
-
미해결현업 실무자에게 배우는 Kaggle 머신러닝 입문 - ML 엔지니어 실무 꿀팁
강의자료
강의 자료 어딧나요 실습자료 !!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!1
-
미해결[개정판] 딥러닝 컴퓨터 비전 완벽 가이드
엥커박스 크기 및 중복 생성 방지에 관한 질문
좋은 강의 찍어주셔서 감사합니다. 해당 강의를 토대로 공부를 하며 모델을 제작 중에 학습 후 inference_detector을 돌리고 나면 같은 물체를 여러번 잡는 문제가 발생합니다. 또한 이용중인 이미지의 크기가 작아서 인지 엥커박스의 크기가 전체 화면을 잡아주는 경우가 발생하고 있습니다. 그래서 이를 방지하고자 rpn_head의 anchor_generator를 수정해보았으나 학습이 안되는 모습을 관찰하였습니다. 사용 모델 :faster_rcnn_r50_caffe_fpn_mstrain_3x_coco.py 이때 사용 이미지의 class는 1개였습니다. 어떤 식으로 이것을 수정할 수 있을까요? 또한 어디 부분의 강의를 들었을 때 이와 관련된 내용을 알 수 있을까요?감사합니다.
-
미해결[개정판] 파이썬 머신러닝 완벽 가이드
feature X 와 target y
feature 표현할 때는 대문자를 써서 X_train 으로 하고target 표현할 때는 소문자를 써서 y_train 으로 작성이 되고 있는데요.대소문자를 구별해서 사용하고 있는 특별한 사유가 있나요?
-
미해결[개정판] 파이썬 머신러닝 완벽 가이드
안녕하세요 강의를 구매해서 잘 듣고있습니다
안녕하세요 강의를 구매해서 잘 듣고있습니다. 혹시 책도 같이 구매를 해야 원활한 학습이 될까요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
결측치 삭제 시 질문
데이터 전처리시 결측치가 있는 컬럼 삭제하는 경우 삭제의 기준이 있나요?! 영상에서는 기준이 없다고 하셨는데 어떤 기준으로 데이터를 삭제하거나, 결측치를 채우시는건가요?!질문결측치 처리시 데이터를 삭제 혹은 채우기를 하는가 그냥 무작위로 해도 무방한지 궁금합니다. 삭제 시 train데이터의 개수와 비슷한 수를 가지고 있는 데이터를 삭제 하시는건가요?!세션5 작업형2 2번째 문제에서는 결측치가 없는 컬럼(host_id)도 삭제 하셨는데 결측치가 없는 컬럼을 삭제해도 무방한가요?결측치 삭제, 채우기 시 강사님만의 기준이 있으신가요ㅜㅜ
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
단일표본검정은 양측검정이다?
본 강의 5분정도쯤에 단일표본검정은 양측검정이다라고 하셨던거 같은데, 단일표본검정이 양측검정이라는 말이 좀 이해가 안가는데요. 혹시 말씀하신 의도가 scipy의 단일표본검정 API의 파라미터 디폴트값이 양측검정이고 (즉, alternative = 'two-sided'), 단측검정의 단일표본검정을 하고싶으면 파라미터값을 조정해야한다는 의미가(alternative = 'greater 또는 less' ) 맞으실까요?'단일표본검정 = 양측검정'은 아닐 것 같아서요!
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
캐글 관련해서 질문드립니다.
T1-11. min-max scaling / #스케일링 #상하위값부터 코드를 입력하는 방식이 달라서 문의 드립니다. 혹시 이전에 있던 1~10번 문제처럼 코드를 작성할 수 있는 방법이 있을까요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
코드 입력할 때 띄어쓰기
학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요먼저 유사한 질문이 있었는지 검색해보세요안녕하세요!의미없는 질문일 수 있으나 계속 궁금해서요..!Q1. 코드 입력할 때 띄어쓰기 관계 없나요?text = "안녕하세요 퇴근후딴짓입니다." text="안녕하세요 퇴근후딴짓입니다."위와같이 = 를 입력할 때 앞뒤로 띄어쓰기를 하지 않아도 결과값이 나오더라구요!Q2. 시험 볼 때는 꼭 띄어쓰기를 해야한다 등의 규칙은 없는거죠?혹시나하여 불안해서 여쭙습니다.Q3. (해도 되고 안해도 되는데) 띄어쓰기를 하는 이유는 코드를 검수할 때 구분이 잘 될 수있도록 위함일까요?커리큘럼 초반인 지금도 자꾸 띄어쓰기 없이 쭉 이어쓰게되네요ㅠㅠ답변 부탁드립니다.
-
미해결[개정판] 딥러닝 컴퓨터 비전 완벽 가이드
안녕하세요 교수님 yolov5 어노테이션 파일 질문드립니다
제가 학습데이터를 받았는데 처음 보는 라벨링 데이터여서 질문드립니다...{"info": [{"name": "Data", "description": "Exported from Superb AI Suite", "url": "https://www.superb-ai.com", "date_created": "2022-01-22 13:27:01.142673"}], "license": [{"name": "", "url": ""}], "images": [{"id": "817233_597", "width": 2800, "height": 2100, "file_name": "817233_597.jpg", "license": "", "date_created": "2022-01-22 13:27:01.142733"}], "annotations": [{"id": "0b2e2051-8bdb-4a3a-92db-436785ff4229", "image_id": "817233_597", "category_id": 223, "segmentation": [{"x": 858.5787945918701, "y": 674.2641079965543}, {"x": 859.5977701409895, "y": 650.3181825922454}, {"x": 863.6736723374677, "y": 636. ... 0664547656428, "y": 671.7166691237555}, {"x": 840.2372347077185, "y": 669.1692302509566}, {"x": 845.8416002278759, "y": 675.7925713202336}, {"x": 858.5787945918701, "y": 674.2641079965543}], "bbox": [767.8899707202322, 634.014573806333, 203.79510982390514, 106.99243265755024], "area": 21804.534563772224, "isSmallType": "N"}], "categories": [{"id": "22b84a7a-3cfe-4cfc-a597-293a6c9e5d42", "class_id": 223, "class_name": "비행기", "superclass_id": 597, "superclass_name": "비행객체"}, {"id": "a5f38f2a-5f4b-443e-bf3e-3c14fc3b3cad", "class_id": 224, "class_name": "헬리콥터", "superclass_id": 597, "superclass_name": "비행객체"}, {"id": "6dac6f54-a2c0-453a-8e40-c609a5f880fb", "class_id": 225, "class_name": "전투기", "superclass_id": 597, "superclass_name": "비행객체"}, {"id": "8f43c9fb-ff34-41db-ad7f-b2c9fb661fe3", "class_id": 226, "class_name": "패러글라이딩", "superclass_id": 597, "superclass_name": "비행객체"}, {"id": "60670ead-f344-4546-a60e-bbf9dfbe3551", "class_id": 227, "class_name": "드론", "superclass_id": 597, "superclass_name": "비행객체"}]}이것은 어떤 형식이며 yolov5 포멧으로 변경하려면 어떡해야 할까요..?감사합니다.- 학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요! - 먼저 유사한 질문이 있었는지 검색해보세요. - 강의 내용을 질문할 경우 몇분 몇초의 내용에 대한 것인지 반드시 기재 부탁드립니다. - 서로 예의를 지키며 존중하는 문화를 만들어가요. - 잠깐! 인프런 서비스 운영 관련 문의는 1:1 문의하기를 이용해주세요.
-
미해결[개정판] 파이썬 머신러닝 완벽 가이드
파이썬 머신러닝 완벽 가이드 개정전 서적
파이썬 머신러닝 완벽가이드 2020버전을 가지고 있습니다2022개정판을 새로 구입해서 강의를 듣는 것이 더 효율적일까요?많이 다르지 않다면 2020년 버전으로 강의를 들어도 문제가 없을지 궁금합니다!!
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
Feature Engineering에서 인코딩 후 데이터를 합칠 때 iloc를 활용하셨는데
안녕하세요! 위와같이 Feature Engineering에서 인코딩 후 데이터를 합칠 때 iloc를 활용하셨는데,iloc는 line을 포함하지 않으니 한 행의 오차 없이, 제대로 train/test 데이터셋을 분리하려면 line+1을 해줘야 하는 게 아닌지 문의드립니다!
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
train값과 test값 unique값이 다를 경우에는 어떻게 하면 되나요?
train값과 test값 unique값이 다를 경우에는 어떻게 하면 되나요? 저번 수업영상에서 두개를 합친 다음에 인코딩을 진행한다고 하셨던거 같은데 다시 한번 질문드립니다.
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
다시 돌아왔습니다
7월에 떨어지고 12월 빅분기 실기 시험 땜에 다시 왔습니다 ㅠㅠ 이번에는 합격할 수 있도록 노력하겠습니다 ㅠㅠ
-
미해결[리뉴얼] 처음하는 파이썬 머신러닝 부트캠프 (쉽게! 실제 캐글 문제 풀며 정리하기) [데이터분석/과학 Part2]
cross_val_score 에러
강의 자료 104 / 106 관련 질문입니다. 104: K-Fold 테스트 안녕하세요 현재 맥북 m2 pro 칩으로 강의를 듣고 있습니다.아래와 같은 에러 나오는데 혹시 해결 방법을 알 수 있을까요?/Library/Frameworks/Python.framework/Versions/3.11/lib/python3.11/site-packages/sklearn/neighbors/_classification.py:228: DataConversionWarning: A column-vector y was passed when a 1d array was expected. Please change the shape of y to (n_samples,), for example using ravel(). return self._fit(X, y)/Library/Frameworks/Python.framework/Versions/3.11/lib/python3.11/site-packages/sklearn/model_selection/_validation.py:842: UserWarning: Scoring failed. The score on this train-test partition for these parameters will be set to nan. Details: Traceback (most recent call last): File "/Library/Frameworks/Python.framework/Versions/3.11/lib/python3.11/site-packages/sklearn/metrics/_scorer.py", line 136, in call score = scorer._score(... 에러 찾다가 못찾고 일단 다음 강의 듣다가 106 자료에서 KNN, Random Forest, Extra Trees 에서 동일 에러가 발생하는 것 같습니다... 일단 강의 듣는걸 멈추고 에러부터 해결해야겠습니다... ㅠㅠ
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
안녕하세요! 3유형 삭제예정 적힌 것은 따로 들을필요 없는거겠죠?
안녕하세요 강의를 조금씩 잘 듣고 있습니다. 질문 드릴게 있는데 제목 그대로입니다. 업데이트 해주신 3유형 강의만 들으면 되겠죠?
-
미해결비전공자를 위한 진짜 입문 올인원 개발 부트캠프
저도 가로 배치가 잘되다가 세로 배치가 되어 질문드립니다.
저도 강의 따라가다가 세로로 갑자기 변환되어서 답변 내용대로 해봤지만 고쳐지지를 않아서 질의 드립니다 아래 코드는 html코드입니다<html> <head> <title>그랩마켓</title> <link href="index.css" type="text/css" rel="stylesheet" /> <body> <div id="header"> <div id="header-area"> <img src="images/images/icons/logo.png"/> </div> </div> <div id="body"> <div id="banner"> <img src="images/images/banners/banner1.png"/> </div> <h1>판매되는 상품들</h1> <div id="product-list"> <div class="product-card"> <img class="product-img" src="images/images/products/basketball1.jpeg"/> <div class="product-contents"> <span class="product-name">농구공 1호</span> <span class="product-price">50000원</span> <div class="product-seller"> <img class="product-avatar" src="images/images/icons/avatar.png"/> <span>그랩</span> </div> </div> </div> </div> <div class="product-card"> <img class="product-img" src="images/images/products/keyboard1.jpg"/> <div class="product-contents"> <span class="product-name">키보드 1호</span> <span class="product-price">30000원</span> <div class="product-seller"> <img class="product-avatar" src="images/images/icons/avatar.png"/> <span>그랩</span> </div> </div> </div> <div class="product-card"></div> <div class="product-card"></div> </div> <div id="footer"></div> </body> </head> </html>아래는 css코드입니다 * { margin: 0; padding: 0; } #header{ height: 64px; display: flex; justify-content: center; border-bottom: 1px solid gray; } #body{ min-height: 100%; width: 1024px; margin: 0 auto; padding-bottom: 24px; } #footer{ height: 200px; background-color: red; } #banner{ height: 300px; background-color: yellow; } #header-area{ width: 1024px; height: 100%; display: flex; align-items: center; } #header-area > img{ width: 128px; height: 36px; } #body > h1{ margin-top: 16px; } #banner > img{ width: 100%; height: 300px; } #product-list{ display: flex; flex-wrap: wrap; margin-top: 12px; flex-direction: row; } .product-card{ width: 180px; height: 300px; margin-right: 12px; margin-bottom:12px; border: 1px solid rgb(230, 230, 230); border-radius: 12px; } .product-img{ width: 100%; height: 210px; } .product-contents{ display: flex; flex-direction: column; padding: 8px; } .product-name{ font-size: 14px; } .product-price{ font-size: 16px; font-weight: 200px; margin-top: 4px; } .product-seller{ display: flex; align-items: center; margin-top: 12px; } .product-avatar{ width: 24px; }바쁘시겠지만 답변 해주시면 감사하겠습니다!+해당 코드 진행 후 개발자 도구 이용해서 보면 flex에 의해 정해지지않은 보라색 칸이 있는데 해당 칸 처리가 힘들어 추가 질문 올립니다!
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
섹션4 - 모의고사1 - 3번 문제
안녕하세요 수강생입니다.강의듣다가 질문이 있어 이렇게 글남깁니다. 섹션4 - 모의고사1 - 3번 문제의 replace를 활용하거나 map을 활용하는 부분입니다. 저는 .replace.replace.replace를 반복하지 않고 아래와 같이 곧바로 딕셔너리 형태로 코드를 치니 마치 map에 딕셔너리를 리스트로 담은 것처럼 동작을 하던데 올바른 방법인지 모르겠습니다.막상 답이 133으로 동일하게 나오다보니 replace나 map의 차이점 또는 딕셔너리의 올바른 활용(?) 부분이 궁금해지네요. import pandas as pd df = pd.read_csv('members.csv') df = df.dropna(subset=['views']) # print(df.isnull().sum()) df['f3'] = df['f3'].fillna(0) df['f3'] = df['f3'].replace({'silver':1, 'gold':2, 'vip':3}) # print(df.head()) print(int(df['f3'].sum()))