묻고 답해요
158만명의 커뮤니티!! 함께 토론해봐요.
인프런 TOP Writers
-
미해결스프링 핵심 원리 - 고급편
로그추적기V1 테스트에서 오류납니다.
구글 클라우드를 사용할 수 있는 환경이 안되서 제 블로그 링크를 붙입니다.https://blog.naver.com/jfk6725/223474471383오류 내용입니다.Execution failed for task ':test'.> There were failing tests. See the report at: file:///C:/CodingStudy/%EC%8A%A4%ED%94%84%EB%A7%81/advanced/advanced/build/reports/tests/test/index.html* Try:> Run with --scan to get full insights.BUILD FAILED in 3s4 actionable tasks: 2 executed, 2 up-to-date
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
모델 randomstate 값
전 강의 분류에서 랜덤포레스트 모델 불러올 때는model = RandomForestClassifier(random_state=2022) randomstate 값 주었는데 이번 강의에서는model = LinearRegression() 값을 주지 않았네요. 전 강의에서는 baseline, 원핫 , 라벨 인코딩 등 여러번 비교하면서 평가해야해서 고정시켜준건가요? 이번 강의에서는 라벨인코딩만 사용하기로 해서 굳이 고정시킬 필요 없나요? 또한 이번 강의에서는 단순 object만 제거하는 baseline, 원핫 인코딩 라벨 인코딩 평가 점수를 비교하지 않는데 이유가 있을까요? 또한 랜덤포레스트, 선형회귀 등 여러 모델이 있는데 어떠한 경우에 각 모델을 사용해야 하는지 기준이 있을까요?
-
해결됨대세는 쿠버네티스 (초급~중급편)
Xshell
안녕하세요! 쿠버네티스 수강생입니다.쿠버네티스 설치 할 때 Xshell 말고 putty로 사용 가능한가요?감사합니다.
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
자꾸 오류가 납니다.
# 검증데이터 분리 from sklearn.model_selection import train_test_split X_tr, y_tr, X_val, y_val = train_test_split(train.drop('TravelInsurance', axis=1), train['TravelInsurance'], test_size=0.2, random_state=2002) X_tr.shape, y_tr.shape, X_val.shape, y_val.shape 이렇게 한 이후에 # 랜덤포레스트from sklearn.ensemble import RandomForestClassifierfrom sklearn.metrics import accuracy_scoremodel = RandomForestClassifier()model.fit(X_tr, y_tr) (밑에 코드는 생략했습니다) 근데 오류가 model.fit(X_tr, y_tr)에서 난다고 뜹니다.오류 : Found input variables with inconsistent numbers of samples: [1192, 298] 이렇게 뜹니다,. 뭐가 문제인지 모르겠습니다.
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
데이터 전처리 중 삭제
타겟 데이터를 보고 타겟 데이터에 영향을 주지 않을 만한 요소들 (이 강의에서는 name, host_name, host_id, last_review )을 직접 EDA 할 때 보고 정해주면 되는 것인가요? 만약 필요한 데이터를 삭제한다든가 불 필요한 데이터를 남겨뒀을 때 평가 지표가 낮게 나온다면 다시 불필요한 데이터를 선별하는 전처리 작업을 반복하면서 진행하는 것인가요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
회귀, 분류
해당 문제가 회귀 문제인지 분류 문제인지는 평가 방법을 통해 판단하는 것인가요? 아니면 타겟 데이터 형태를 통해서 판단하는 것인가요?타겟 데이터가 0,1 분류 데이터면 분류를하고타겟 데이터가 그렇지 않을 때 회귀 적용하는 것인가요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
작업형2 평가
제 기준에서는 baseline (단순 object 제거)으로 했을 때점수가 가장 높았습니다. 질문 강사님은 레이블 인코딩일 때 auc 점수가 가장 높던데 학습 데이터가 동일하더라도 평가 점수는 다를때가 많나요? 문제에서 auc 등 어떤 지표를 기준으로 평가하는지 명시해주나요? 그러면 그 평가 지표가 가장 높은 피처 엔지니어링 방법으로 진행하면 될까요?수치형 데이터 스케일링은 진행 안 하신 이유가 궁금합니다.
-
미해결
인프런 수강 진도를 모두 완료했는데, 수료증이 나타나지 않습니다.
HTML5 & CSS3 기초 문법 올인원제가 듣고 있는 강의입니다. 수료를 위해 증빙을 해야 하는데, 수료증을 확인할 방법이 없네요... 이런 경우는 어떻게 해야 할까요?강의는 모두 완강했습니다.
-
미해결Kevin의 알기 쉬운 Spring Reactive Web Applications: Reactor 1부
advancedTimeBy와 thenAwait 사용 예시가 궁금합니다
안녕하세요, advancedTimeBy와 thenAwait 사용 예시를 모르겠어서 문의드립니다.강의 중 advancedTimeBy는 '특정 시간을 당겨서 앞서 나가는 것'이라 설명해주셨고, thenAwait은 해당 시간이 빠르게 다가오는 걸로 이해하면 된다고 설명해주셨습니다. 궁금한 점은1) 각각의 테스트가 필요한 예시를 조금만 더 자세히 들어주실 수 있으실까요? 특정 프로젝트에서 어떤 상황일 때 해당 방법이 필요한지 감이 잡히지 않습니다.1-2) 어떤 상황에 필요한 것인지 모르다보니, advancedTimeBy와 thenAwait의 쓰임이 분명히 구분돼 있을텐데도 유사한 방식이 아닌가? 라는 생각이 듭니다. 이 부분도 예시로 설명해주실 수 있다면 함께 설명해주시면 감사하겠습니다.
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
model.selection 하는경우와 안하는경우
1) 안녕하세요 sklearn.model_selection ~ 으로 트레인/테스트 분리하는건 어떤상황에서 하고 어떤상황에서 안하는지 궁금합니다. 직전 4회 기출(작업형2)에서는 basic/intermediate 단계에서는 안했던것 같거든요, 마찬가지로 5회기출도 분리하지 않고 랜덤포레스트로 예측진행해도 될까요? 해도되고 안해도되는 상황을 잘모르겠어서 질문드려요 2) 그리고 어떤상황에서는 random_state=2022 이고 어떤때는 random_state=0 이던데 이것도 사용 기준이 있을까요?
-
미해결
스프링 junit 테스트 중 createdAt 같은 시간 생성
안녕하세요 junit으로 테스트 코드를 작성하던 중 질문사항이 생겨 글 남깁니다.[상황]private void setData(){ // A는 BaseEntity를 상속 받고 있으며 그안에는 createdAt()이 있습니다. A a1 = A.builder() .... .build(); em.persist(a1); ,,, em.persist(a2); ,,, em.persist(a3); ,,, em.persist(a4); } @Test void test1(){ //Given setData(); //When // a1,a2,a3,a4 에 대해 createdAt()으로 내림차순 정렬합니다. }이때 제가 동작하였을 때는 문제가 없었는데 팀원 분이 실행했을 때 에러가 발생했습니다.아래 그림과 같이 nana4,5 가 createdAt이 같은 시간으로 등록되었고 이 부분에서 정렬하는데 문제가 발생하였습니다.질문 1.저의 작업환경에서는 이런 상황이 발생하지 않고 항상 1~5까지의 nana가 다른 creatdAt시간을 갖고 있었습니다. 하지만 다른 팀원의 작업 환경에서는 동시간으로 입력되는 상황이 발생하였는데 이는 컴퓨터의 성능 차이일까요?질문 2.해결을하기 위해서 검색을 해보다가 em.persist()다음에 Thread.sleep()을 작성하는 방법을 찾았으나 옳은 방법인지 고민이 되고있습니다. 더 적합한 해결책이 있을지 궁금합니다
-
미해결실전! 스프링 부트와 JPA 활용2 - API 개발과 성능 최적화
제네릭 DTO 질문
[질문 템플릿]1. 강의 내용과 관련된 질문인가요? (예/아니오)2. 인프런의 질문 게시판과 자주 하는 질문에 없는 내용인가요? (예/아니오)3. 질문 잘하기 메뉴얼을 읽어보셨나요? (예/아니오)[질문 내용]static class Result<T> {private T data;}위와 같은 Result를 static으로 선언해서 inner class로 여기서는 사용을 하였는데요, 이를 패키지 바깥에 전역적으로 사용할 수 있도록 하나의 클래스로 선언하는 것과 inner class로 사용할 때 어떤 차이가 있을지 궁금합니다.가령, 어떤 Response에서는 count라는 필드가 필요하고, 어떤 Response에서는 message라는 필드가 필요하다고 하면, 전역적으로 Result라는 DTO를 하나의 public 클래스로 만들어둔다면 위 상황을 처리하기 힘들 것 같은데 어떠한 방식이 객체지향적인 방식일까요?
-
해결됨독하게 시작하는 C 프로그래밍
malloc 함수의 형변환(?) 질문드립니다!
(int*)malloc( sizeof(int) * 4 )(char*)malloc( sizeof(char) * 4 )와 같이 malloc 함수 선두에 등장하는 (자료형*)은 무엇을 의미하고 어떻게 작동하는 것인지 알고 싶습니다! 항상 좋은 강의 감사드립니다!
-
해결됨실무에서 사용하는 클라우드 보안 프로그래밍 (AWS, Python, Terraform)
generate expression 사용 예시
안녕하세요 1.14 generator expression 강의 내용 중에서 athena로 s3의 저장된 로그를 쿼리하여 로그를 긁어온다는 예시에서 2가지 궁금증이 있습니다. 아테나로 긁어온 로그의 용량이 큰 경우, 리스트 컴프랜션으로 올리면 메모리를 많이 차지한다고 말씀해주셨습니다.아테나 쿼리 결과는 보통 s3에 저장되는데, 람다를 예시로 들으신 이유는 어떤 워크플로우를 생각하시고 예시로 들으신건지 궁금합니다.(람다로 아테나 쿼리 결과를 읽고 특정 형태로 파싱하는 경우, 파일을 리스트 컴프랜션으로 읽으면 람다의 메모리를 오바하여 람다가 죽는 경우를 말씀해주신걸까요?)임시스토리지에 저장해서 generate expression을 통해 읽어온다는 부분에서 궁금한 점입니다.레디스로 예를 들면 아테나 쿼리 결과를 [{"key" : "value"}]와 같이 레디스에 저장해둔 후 필요 시 데이터를 generate expression을 사용해서 읽어 온다는 걸까요? 저같은 경우 아테나는 단순 로그 파일을 조회하는 용도로만 사용해 보았고, 람다와 연동해서 사용해 본 경험이 없어 예시로 들어주신 사례가 어떤 상황인지 명확하게 떠오르지가 않습니다.이런 부분은 검색을 통해 개인적으로 찾아봐야 되는게 맞는데, 어떤 키워드로 검색해야 하는지 감이 잘 안와서 질문드리게 됐습니다.
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
4회 기출 유형 (작업형2) 관련 질문
안녕하세요 선생님!xgboost를 사용해 예측을 진행하려고 하니, ValueError: Invalid classes inferred from unique values of `y`. Expected: [0 1 2 3], got [1 2 3 4]위와 같은 에러코드가 나와, chat gpt에 물어보니, XGBoost가 클래스 레이블을 0부터 시작하는 정수 값으로 기대하기 때문입니다. 즉, XGBoost는 클래스 레이블이 [0, 1, 2, 3]과 같은 형식을 갖추기를 기대하는데, 현재 데이터는 [1, 2, 3, 4]로 되어 있습니다.이 문제를 해결하려면 클래스 레이블을 0부터 시작하도록 변경해야 합니다. 라고 답변을 주었는데, 코드를 수정해준 것을 보니, y 변수에 train['Segmentation']을 할당하여 LabelEncoding 을 진행하여 0부터 시작하는 데이터로 변환시켜주는 코드를 줬는데, 이 코드를 사용하여 예측하고 제출 csv 파일까지 만들어 확인해보니, Segmentation 예측을 1,2,3,4 로 한 것이 아닌 0,1,2,3 으로 예측하였는데...xgboost를 사용하기 위해서는 어느 부분을 수정하여야 할까요? 감사합니다.
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
기출4회 유형2 문의드립니다.
기출4회 유형2 문의드립니다.Macro f1-core는 #*****평가(=교차검증)from sklearn.model_selection import cross_val_scorescore = cross_val_score(model, train, train['Segmentation'], scoring='f1_macro', cv=5)print(score)print(score.mean())이렇게 구하면 되는건가요? 그리고 아래와 같이 풀이해봤는데강사님께서 풀이하신 segmentation과 다른데 괜찮나요? 풀이과정에 문제는 없는지 확인 부탁드립니다. # 라이브러리 불러오기import pandas as pd# 데이터 불러오기train = pd.read_csv("train.csv")test = pd.read_csv("test.csv")#*****데이터확인train.shape, test.shapetrain.head(2)test.head(2)#문자형 6개# train.info()#결측치 없음train.isnull().sum()test.isnull().sum()#*****전처리#결측값 없음#train합치기 없음#인코딩from sklearn.preprocessing import LabelEncodercols= train.select_dtypes(include='object')colsfor col in cols : le = LabelEncoder() train[col] = le.fit_transform(train[col]) test[col] = le.transform(test[col])#id삭제train = train.drop('ID',axis=1)test_ = test.pop('ID')#*****분리from sklearn.model_selection import train_test_splitX_tr, X_val, y_tr, y_val = train_test_split( train.drop('Segmentation',axis=1), train['Segmentation'], test_size=0.2, random_state=2022)#*****모델 max_depth=5~7 / n_estimators= 100~1000from sklearn.ensemble import RandomForestClassifiermodel = RandomForestClassifier(random_state=0, max_depth=7, n_estimators=500)model.fit(X_tr, y_tr)pred = model.predict(X_val)#*****평가(=교차검증)from sklearn.model_selection import cross_val_scorescore = cross_val_score(model, train, train['Segmentation'], scoring='f1_macro', cv=5)print(score)print(score.mean())#*****예측pred = model.predict(test)predsubmit = pd.DataFrame({ 'ID': test_ID, 'Segmentation': pred})submit#*****저장submit.to_csv('submission_csv', index=False)pd.read_csv('submission_csv')
-
미해결코딩으로 학습하는 GoF의 디자인 패턴
volatile 사용 이유에 대해서 여쭤보고 싶습니다!
- 학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요! - 먼저 유사한 질문이 있었는지 검색해보세요. - 서로 예의를 지키며 존중하는 문화를 만들어가요. - 잠깐! 인프런 서비스 운영 관련 문의는 1:1 문의하기를 이용해주세요. synchronized 메서드 블록에서 사용되는 모든 공유변수는 동시성처리를 위해서 공유 변수에 volatile 키워드가 없어도 가시성이 확보되는 것으로 배웠는데 혹시 제가 잘못 알고있는건지 궁금해서 질문드립니다!
-
미해결
df[['score']]에서 괄호가 두번씩 쓰이는 이유가 궁금합니다
df['score'] = scaler.fit_transform(df[['score']]) round(df['score'].max(),3) df[['score']] 에서 괄호[]가 두번씩 들어가는 이유가 궁금합니다.
-
해결됨Python Streamlit을 활용한 대시보드 만들기 (feat. 빅데이터 분석기사 실기 준비)
가상환경 설치(virtualenv) 중 오류 문의드립니다.
안녕하세요 Evan님의 Streamlit을 활용한 대시보드 만들기 강의를 듣고 있는 구자원 입니다.이제 강의를 수강 시작해서 [1단계 : Python 개발환경설정] 진행하고 있는데요.가상환경 설치(virtualenv) 강의 들으면서 설치 따라 하는 중에pip install numpy pandas jupyterlab streamlit plotly matplotlib seaborn진행하려고 하는데 아래 이미지와 같이 에러 메시지가 떠서 패키지 설치가 안되고 있습니다.아마 강의 후 시간이 지나면서 시간차로 파이썬 버전 문제로 이런 문제가 발생하는 것 같은데 해당 증상 해결법 확인해주실 수 있으신지요?? 확인 부탁드립니다.
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
3-4 MinMaxScaling
안녕하세요. 범주형/수치형을 구분하지 않고 시험에서 진행하는 것이 좋다고 이전 유사질문에 답변주신 내용은 확인하였으나, 단순 궁금함으로 질문드립니다. 3-4 예시에서 이미 수치형과 범주형 데이터를 구분하여n_train에는 수치형 데이터 타입의 컬럼만 남아있는 것으로 이해했는데 아래와 같이 별도로 cols라는 수치형 컬럼만 모은 리스트를 따로 만들어 코드 작성을 진행하는 이유가 있을까요? n_train[cols] = scaler.fit_transform(n_train[cols]) 여기서 [cols]를 지웠더니 numpy 관련 오류가 나는 것으로 확인하였는데 자세한 내용이 궁금합니다!