묻고 답해요
164만명의 커뮤니티!! 함께 토론해봐요.
인프런 TOP Writers
-
미해결[리뉴얼] 처음하는 파이썬 머신러닝 부트캠프 (쉽게! 실제 캐글 문제 풀며 정리하기) [데이터분석/과학 Part2]
자료공유를 받으려고 하는데 에러가 납니다.
등록 중 오류 발생: 권한 부여 중 오류가 발생했습니다: <HttpError 400 when requesting https://www.googleapis.com/drive/v3/files/1s9q_Rsc3ze_i6NG-g4VGTIq4eGDeILab/permissions?fields=id&alt=json returned "Bad Request. User message: "Sorry, you cannot share with that many individual recipients. You can share with more people by using Google Groups."". Details: "[{'message': 'Bad Request. User message: "Sorry, you cannot share with that many individual recipients. You can share with more people by using Google Groups."', 'domain': 'global', 'reason': 'invalidSharingRequest'}]"> 자료공유 폼에 작성후 등록하면 이러한 에러가 발생합니다
-
미해결딥러닝 CNN 완벽 가이드 - TFKeras 버전
데이터 증강
안녕하세요.먼저 좋은 강의 감사합니다. 강의를 듣는 중에 궁금한 점이 몇가지 생겨 질문 남깁니다.이미지 증강 시, 증강 기법을 너무 많이 적용해도 오히려 성능이 떨어지며, 성능을 봐가면서 기법을 선택해야하는 걸로 알고 있습니다. 근데, 어떤 기법이 적절한지 알지 못하는 상황에서 어떻게 탐색해야할까요? 하나씩 적용하고 성능을 보기에는 기법이 너무 다양해서요배치마다 증강 기법을 적용하는 방식으로 진행중인데, 성능이 계속 이전 대비 떨어지는 현상을 보입니다. 확률을 만져줘야 하나요?(현재 0.5)이미지 증강을 사전에 하여 학습 데이터를 늘리는 사람들도 있던데, 이 사람들은 어떤 의도로 그러시는건지 궁금합니다.감사합니다.
-
미해결캐글 Advanced 머신러닝 실전 박치기
8분 40초경 LGBClassifier에서 설정해주신 파라미터들 관련 질문
from lightgbm import LGBMClassifier clf = LGBMClassifier( n_jobs = -1, n_estimators = 1000, learning_rate = 0.02, num_leaves = 32, subsampls = 0.8, max_depth = 12, silent = -1, verbose = -1 ) clf.fit(train_x, train_y, eval_set=[(train_x, train_y), (valid_x, valid_y)], eval_metric='auc', verbose = 100, early_stopping_rounds=50)안녕하세요 강사님, 8분 40초 경에 나오는 위 코드 설명 중에서 LGBClassifier에 들어가는 파라미터들에 대해 질문드립니다. 이번 회차에서는 LGBM을 통한 분류에서 파라미터 튜닝을 거의 하지 않은 채 기본적인 base 피처들을 이용하였고, learning_rate, num_leaves, max_depth와 같은 하이퍼 파라미터들에 대해서도 아주 간단하게만 설정해주셨는데요.어떠한 요령이나 기준을 가지고 위와 같은 하이퍼 파라미터를 설정해주셨는 지가 궁금합니다. 실제 실무에서도 받은 데이터들에 대해 기본적으로 가공하지 않고 알고리즘을 우선 돌려보며 기본적인 데이터들의 예측력 지표를 확인해보는 작업을 여럿 해볼 것 같다고 생각이 듭니다.때문에 이렇게 미가공 상태에서 raw데이터들만 가지고 한 번 돌려보면서 감을 잡을 때 강사님께서 설정하신 것처럼 대략적으로나마 하이퍼 파라미터 값을 넣어준다면 어떤 하이퍼 파라미터에 어떤 값을 줄지에 대해 어떻게 결정하시는 지가 궁금합니다. (그리드서치나 하이퍼옵트 등을 이용해서 처음부터 최적의 하이퍼 파라미터를 찾아가는 건 단계상 너무 본격적인 것 같아서요!)
-
미해결[리뉴얼] 처음하는 파이썬 머신러닝 부트캠프 (쉽게! 실제 캐글 문제 풀며 정리하기) [데이터분석/과학 Part2]
iplot에서 항상 에러나는 분 안계신가용?
iplot 사용중에 항상 에러가 나는데 원인을 모르겠네요 ㅠㅠ색 관련 에러라고 뜨는데 구글에 검색해도 안나옵니다 ㅠ
-
미해결[리뉴얼] 처음하는 파이썬 머신러닝 부트캠프 (쉽게! 실제 캐글 문제 풀며 정리하기) [데이터분석/과학 Part2]
사망 여부 영향 가능성
Survived 에서 뽑아냈을 때 수치가 높게 나오면 영향 가능성이 높다고 판단하면 되는건가요?
-
미해결[입문자를 위한] 캐글로 시작하는 머신러닝 • 딥러닝 분석
섹션 3-4 데이터 전처리하기
다음과 같은 에러가 발생합니다.
-
미해결캐글 Advanced 머신러닝 실전 박치기
사용 가능한 RAM을 모두 사용한 후 세션이 다운되었습니다
sns.distplot(app_train[cond1 & cond_amt]['AMT_INCOME_TOTAL'], label='0', color='blue')이 코드를 실행하면 colab 환경에서 '사용 가능한 RAM을 모두 사용한 후 세션이 다운되었습니다.' 에러가 뜹니다. 그렇게 무거운 데이터도 아닌데 왜 이러는 걸까요? 진도를 빼지 못하고 있네요 ㅠㅠ
-
해결됨딥러닝 CNN 완벽 가이드 - TFKeras 버전
albumentations ShiftScaleRotate
ShiftScaleRotate에서 Only Scale 변환 후 원본 이미지와 사이즈가 같은 이유가 무엇인지 궁금합니다.ShiftScaleRotate 내부에서 원본 크기로 resize해주는 것인지 내부에서 Super Resolution을 적용해주는 것인지 궁금합니다. 화질이 손상되지 않은거 같아서 여쭈어봅니다.
-
미해결[리뉴얼] 처음하는 파이썬 머신러닝 부트캠프 (쉽게! 실제 캐글 문제 풀며 정리하기) [데이터분석/과학 Part2]
섹션4_인코딩 이해하고 적용해보기(원핫인코딩) 질문
섹션 4 부분 마지막 강의인 인코딩 이해하고 적용하기 라는 강의의 14분 50초에 나오는 pd.getdummies()에 관한 질문이 있습니다.강의 내용대로 실행을 시켜보니 df_onehot.head()의 내용이 True/False의 형태로 나오는 것을 확인했습니다.서칭 후 pd.get_dummies(df_label, columns=onehot_cols, dtype = int) 처럼 dtype을 int형태로 바꾸어주니 강사님이 보여주신 화면대로 나오는 것을 확인했습니다.이것 역시 버전차이로 인한 기능 변화라고 이해하면 되나요?
-
미해결딥러닝 CNN 완벽 가이드 - TFKeras 버전
Model Input Size 관련
먼저, 비전공자도 이해할 수 있도록 섬세하게 강의해주셔서 감사합니다.강의에서 efficientnet, xception 등 좋은 딥러닝 모델들을 소개해주셨는데요 실제 어떤 모델이 좋을지 테스트하다 보니 Input size 관련해서 아래와 같은 궁금증이 생깁니다.모델마다 권장 사이즈가 다 다르던데 여러 모델을 테스트 할 때 모델별 권장 Input size로 resize 하는게 좋을까요? 아니면 특정 사이즈로 고정해서 테스트 하는 것이 좋을까요? 이미지를 축소하는 경우보다 확대해서 모델에 넣는 경우 성능이 더 안 좋을까요?
-
미해결캐글 실습으로 배우는 데이터 사이언스
수료증 발급 문의
안녕하세요.강의 수강 완료 후 수료증 발급에 대해서 문의드립니다.절차가 어떻게 되는지, 수료증 어디서 받아야하나요?회사 제출 용도로 필요하기에 문의드려요
-
미해결[리뉴얼] 처음하는 파이썬 머신러닝 부트캠프 (쉽게! 실제 캐글 문제 풀며 정리하기) [데이터분석/과학 Part2]
df.corr(numeric_only=True).iplot() 에러 해결 어떻게 해야되나요?
vscode에서 ipynb파일에서 iplot사용 동일한 에러가 발생합니다. 타이타닉 문제로 시작하는 EDA: 수치형 데이터 분석 패턴1에서df.corr(numeric_only=True).iplot(kind='histogram', histfunc='count')했는데해당 에러가 발생합니다.현재 버전은 이렇습니다.plotly==4.14.3cufflinks==0.17.3
-
미해결캐글 Advanced 머신러닝 실전 박치기
안녕하세요 선생님
안녕하세요 선생님.. 구글클라우드로 알려주신것처럼 사용했는데요 (3월달쯤)무료크래딧 받고, 하루이틀 사용하다가 그 뒤에는 그냥 로컬로 사용했습니다.그런데 오늘보니까 6만원이 미납됬다고,. 그래서 결제를 하라고 하는데. 이거 결제해야하는건가요? ㅠ거의 쓰지도 않았는데, 그냥 과금이 되버리는건지 어째야하나요ㅜㅜ
-
미해결현업 실무자에게 배우는 Kaggle 머신러닝 입문 - ML 엔지니어 실무 꿀팁
from sklearn.datasets import load_boston
강의중 from sklearn.datasets import load_boston자료를 읽어올시 오류가 발생합니다.
-
미해결현업 실무자에게 배우는 Kaggle 머신러닝 입문 - ML 엔지니어 실무 꿀팁
df.get_dummies 실행시 이진법이 아닌 false 또는 True로 반환됨.
df = pd.get_dummies(df, columns = ['Location', 'WindGustDir', 'WindDir9am', 'WindDir3pm']) MinTemp MaxTemp Rainfall Evaporation Sunshine WindGustSpeed WindSpeed9am WindSpeed3pm Humidity9am Humidity3pm ... WindDir3pm_NNW WindDir3pm_NW WindDir3pm_S WindDir3pm_SE WindDir3pm_SSE WindDir3pm_SSW WindDir3pm_SW WindDir3pm_W WindDir3pm_WNW WindDir3pm_WSW 0 13.4 22.9 0.6 4.4 8.2 44.0 20.0 24.0 71.0 22.0 ... False False False False False False False False True False 1 7.4 25.1 0.0 4.4 8.2 44.0 4.0 22.0 44.0 25.0 ... False False False False False False False False False True 2 12.9 25.7 0.0 4.4 8.2 46.0 19.0 26.0 38.0 30.0 ... False False False False False False False False False True 3 9.2 28.0 0.0 4.4 8.2 24.0 11.0 9.0 45.0 16.0 ... False False False False False False False False False False 4 17.5 32.3 1.0 4.4 8.2 41.0 7.0 20.0 82.0 33.0 ... False True False False False False False False False False 5 rows × 106 columns one hot encoding시에 이진법(0 또는 1)로 반환되어야하는데 false 또는 True로 반환됨.
-
미해결현업 실무자에게 배우는 Kaggle 머신러닝 입문 - ML 엔지니어 실무 꿀팁
선형회귀 곡선 응용편에서 alpha값이 의미하는 것은 무엇인가요?
선형회귀 곡선 응용편에서 alpha값이 의미하는 것은 무엇일까요?알파값이 감소할수록 성능이 좋아지는 것인지 아니면 적당한 값이 있는것인지요?
-
미해결현업 실무자에게 배우는 Kaggle 머신러닝 입문 - ML 엔지니어 실무 꿀팁
수업자료 요청 skahffk94@naver.com
수업자료 요청부탁드립니다.skahffk94@naver.com
-
미해결현업 실무자에게 배우는 Kaggle 머신러닝 입문 - ML 엔지니어 실무 꿀팁
실습중에 주가_데이터.T.loc T는 무엇인가요?
my_df = 주가_데이터.T.loc['2020-09-09':,'A005930':'A005990']
-
미해결현업 실무자에게 배우는 Kaggle 머신러닝 입문 - ML 엔지니어 실무 꿀팁
parsererror
실습을 똑같이 따라하는 중인데 parsererror가 뜹니다.이유가 무엇을까요? 주가_데이터 = pd.read_csv('stock.adj_close.csv', index_col=0) my_series = 주가_데이터.loc['A005930']['2020-09-09':] ParserError Traceback (most recent call last) <ipython-input-16-e728d7ea27ad> in <cell line: 1>() ----> 1 주가_데이터 = pd.read_csv('stock.adj_close.csv', index_col=0) 2 my_series = 주가_데이터.loc['A005930']['2020-09-09':] 8 frames/usr/local/lib/python3.10/dist-packages/pandas/_libs/parsers.pyx in pandas._libs.parsers.raise_parser_error() ParserError: Error tokenizing data. C error: Expected 583 fields in line 238, s
-
미해결파이썬 기초 라이브러리부터 쌓아가는 머신러닝
파일을 읽어들일 때 질문 있습니다
2분 44초 파일을 읽어들일 때 base_src 에 할당 할 때 machine_learning_data뒤에다가 바로 friend.csv을 이어서 붙이면 안되나요?