묻고 답해요
158만명의 커뮤니티!! 함께 토론해봐요.
인프런 TOP Writers
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
회귀계수, 절편 뜻
회귀계수(coef) 뜻이 독립변수가 종속변수에 미치는 영향의 크기/방향을 의미하고절편(intercept)뜻이 모델이 독립변수들의 영향을 받지 않을 때 예측하는 종속변수의 기본 로즈 오즈라고 알고 있습니다. 각 독립변수들의 coef 값은 이해가 가는데 위의 표에서 intercept의 coef값은 무엇을 의미하는지 궁금합니다! 또 기울기 = 회귀계수 = coef / 절편 = intercept 로 이해하면 되나요!?통계에 대한 기초가 없어서 유형 3이해하는게 어려움이 많습니다ㅠㅠㅠㅠ 감사합니다!!!
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
ttest 귀무 가설 관련 문의
ttest에서 밑에 코드의 대립가설이 120보다 작다라는 거는 이해를 했는데귀무 가설은 항상 기준값 여기는 120과 같다인가요? 대립가설이 120보다 작다라면 귀무가설은 120보다 작지 않다가 되어야 하는건 아닌가 궁금해서요
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
datetime변환 관련
안녕하세요. 6회 기출 작업형 1번 관련 질문이 있습니다. 2024년 2월 이런 형태여서, datetime으로 변환하려고 했었는데 안되더라구요제가 사용한 코드는pd.to_datetime(df['연도'), format ='%Y년%m월') 입니다. format으로 datetime으로 변환하려면 연/월/일 모두 데이터가 있어야하는걸까요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
코드 질문입니다!
선생님 라벨인코딩과 모델링에서 코딩을 할 때 둘 다 le = LabelEncoder(), le = RandomForestClassifier(random_state=2022)와 같이 le = 으로 받고 le를 활용했는데 결과값에 영향이 있을까요?
-
해결됨스프링부트 JUnit 테스트 - 시큐리티를 활용한 Bank 애플리케이션
권한처리를 위한 세션강제주입
/api/admin 요청 시 권한만을 체크하기 위해 id 와 role 만 있는 객체를 시큐리티세션에 저장했다고 하셨는데만약 username 이나 email 이 필요한 경우라면 그 로직도 BasicAuthenticationFilter 를 상속받은 필터에서 doFilterInternal() 메서드 안에서 강제주입을 할때 username 과 eamil을 가져와서 시큐리티 세션에 강제주입하는건가요 ?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
섹션5 작업형2 모의문제2 질문 있습니다.
안녕하세요 섹션5 작업형2 모의문제2 에서 질문이 있습니다. 각 모델링을 통해서 r2 score 값을 구하는 부분에서강의 답안에서는 XGBRegressor에서 설명력이 제일 높았어요 강의 중에 train_test_split 의 random_state = 2022로 했는데이 값을 변경하니, XGBRegressor의 r2 score 값이 심하게 바뀝니다.다른 회귀 모델들은 그렇지 않았는데, 유독 XGBRegressor에서만 변경이 심하더라고요예를 들어서, random_state = 2023으로 하면 가장 낮은 r2 score가 나와서 결론이 완전 바뀝니다.이 부분 설명 부탁드립니다. 그리고 추가 질문입니다.이 부분에 RandomForestRegressor를 이용해서 모델링할 때강의에서는 regressor = RandomForestRegressor() 라고 되어서 모델링이 제대로 되지 않았어요그런데, model = RandomForestRegressor() 로 하면 1분 이상 실행이 되어 버립니다.RandomForestRegressor를 이용한 모델링 방법 요청드립니다.답변 부탁드려요~
-
미해결홍정모의 따라하며 배우는 C++
visual studio for mac c++ 선택
- 학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요! - 먼저 유사한 질문이 있었는지 검색해보세요. - 서로 예의를 지키며 존중하는 문화를 만들어가요. - 잠깐! 인프런 서비스 운영 관련 문의는 1:1 문의하기를 이용해주세요. 문의 드렸을 때 c++로 변경하라고 하셨는데 c++ 자체가 없습니다... ㅜㅜ
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
3-4 피처엔지니어링 민맥스스케일러 질문
선생님이 민맥스스케일러 코드를# 민-맥스 스케일링 MinMaxScaler (모든 값이 0과 1사이) cols = ['age', 'fnlwgt', 'education.num', 'capital.gain', 'capital.loss', 'hours.per.week']n_train, n_test, c_train, c_test = get_nc_data() # 데이터 새로 불러오기from sklearn.preprocessing import MinMaxScalerscaler=MinMaxScaler()n_train[cols]=scaler.fit_transform(n_train[cols])이렇게 작성하신 부분을 제가 라벨인코더 코딩처럼 변경해봤는데요(from sklearn.preprocessing이 똑같은거랑 구조가 비슷해서요)from sklearn.preprocessing import MinMaxScaler for col in cols: sc=MinMaxScaler() X_train.col=sc.fit_transform(X_train[col]) X_test.col=sc.transform(X_test[col]) 이런에러가 떴어요if your data has a single feature or array.reshape(1, -1) if it contains a single sample. 코딩구조가 비슷한거같아서 한번 시도해봤는데 민맥스스케일러는 LabelEncoder() 할때와 코드를 비슷하게 칠순없는건가요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
작업형 3 예시문제(구버전)
학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요먼저 유사한 질문이 있었는지 검색해보세요(b)풀 때, 문제에서 정규성에 대한 말이 없는데 정규성 검정을 하지 않고 바로 ttest_rel을 써도 되나요? (c) 답안의 경우 0.0006, 귀무가설을 기각하고, 대립가설을 채택한다. 라고 쓰면 되나요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
마지막 csv 결과파일 만들 때 문제점
위에는 다 똑같이 따라했고, 마지막에 저런 오류가 뜨는데 무슨 문제일까요..?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
formula.api logit 범주형변수
안녕하세요. 로지스트회귀분석 formula.api 에서 logit 을 사용할 때,예를들어 성별 F, M 을 C()로 묶어주면 여자성별은 사라지는데, 1.여기서 다른 변수들은 고정되어있고, 여성에 비해 남성의 오즈비를 구하려면 어떻게 해야하나요?2. 예측값을 넣을때model.predict() 를 사용하라고 배웠습니다. 안에는 새로운 데이터를 넣고, 근데 이 새로운 데이터를 기존 주어진 데이터 프레임의 한 행에서 가져와서 넣고, 예측확률을 구하는 것은 어떻게 하나요?
-
미해결AWS Certified Solutions Architect - Associate 자격증 준비하기
수강 기한 연장
강사님. 안녕하세요.수강 연장을 부탁드립니다.프로패셔널 시험을 준비중인데 해당 강의들도 같이 챙겨서 보려구합니다.부탁드리겠습니다.
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
T2-1. 타이타닉 문제 질문있습니다.
저는 지금까지 작업형2 모든 유형의 문제를 object컬럼은 라벨인코딩을 했습니다.이번에도 라벨인코딩을 하려고 보니 오류가 나서 이전에 질문을 드렸고,X_train과 X_test의 데이터 수가 달라 있는 오류라고 설명해주셨습니다. 그래서 X_train과 X_test의 object 컬럼에 nuniqe, describe, velue_counts등의 함수를 적용하여 확인해보았습니다.근데 'Embarked'컬럼은 X_train과 X_test내 데이터 종류 수와 종류도 동일한데, 라벨인코딩을 적용하려하니 계속 이런 오류가 뜹니다.Encoders require their input to be uniformly strings or numbers. Got ['float', 'str']오류가 뜨는 원인과 왜 'Embarekd'컬럼을 drop했을 때는 모델이 잘 적용되는지가 궁금합니다.일단 밑에는 제가 'Embakred'컬럼을 drop한 코딩입니다. # EDA # X_train.info() # X_test.info() # drop & pop : PassengerId(pop) # 추가 삭제 : Cabin, Embarked, Ticket, Name # 결측치 : Age-수치형(결측값 중간값으로 채움), Cabin!!-범주형(얘는 원래 최빈값으로 채우려다가.. 값이 너무 많아서 삭제함) # 범주형 : Sex(라벨), Embarked!!(), Ticket!!, Name!!, Cabin!!(얘네 셋은 원래 라벨인코더 하려다가, train과 test의 nunique값이 달라서 삭제함), # 수치형 : Pclass, SibSp, Parch, Fare, Age(로버스터스케일러) # y_train.info() : PassengerId, Survived X_train = X_train.drop(columns = ['Ticket', 'Name', 'PassengerId', 'Cabin', 'Embarked']) X_test = X_test.drop(columns = ['Ticket', 'Name', 'Cabin', 'Embarked']) X_test_id = X_test.pop('PassengerId') y_train = y_train.drop(columns = ['PassengerId']) X_train['Age'] = X_train['Age'].fillna(X_train['Age'].mean()) X_test['Age'] = X_test['Age'].fillna(X_test['Age'].mean()) from sklearn.preprocessing import RobustScaler num = ['Pclass', 'SibSp', 'Parch', 'Fare', 'Age'] scaler = RobustScaler() X_train[num] = scaler.fit_transform(X_train[num]) X_test[num] = scaler.transform(X_test[num]) from sklearn.preprocessing import LabelEncoder cols = ['Sex'] encoder = LabelEncoder() for col in cols : X_train[col] = encoder.fit_transform(X_train[col]) X_test[col] = encoder.transform(X_test[col]) from sklearn.model_selection import train_test_split X_tr, X_val, y_tr, y_val = train_test_split(X_train, y_train, test_size = 0.2, random_state = 2022) from sklearn.ensemble import RandomForestClassifier model = RandomForestClassifier() model.fit(X_tr, np.ravel(y_tr)) pred = model.predict(X_val) from sklearn.metrics import accuracy_score accuracy_score(y_val, pred) pred = model.predict(X_test) pd.DataFrame({'PassengerId' : X_test_id, 'Survived' : pred}).to_csv('00000.csv', index = False) pd.read_csv('00000.csv') X_train.shape, X_test.shape, y_train.shape
-
해결됨김영한의 자바 입문 - 코드로 시작하는 자바 첫걸음
이종간 OS 클래스 문의
안녕하세요. 영한쌤.개발자 PC 윈도우에서 컴파일한 클래스가 유닉스에서 안돌아가는 경험을 한 적이 있는데 java1.5 PC 윈도우, java1.5 서버 유닉스최근 버전 자바에서는 class파일이 이종간 OS도 지원할까요? 아니면, 제환경이 문제가 있었을까요? 오래된 기억이라 동일한 자바 버전이었는지 기억이 안나네요.좋은 강의 정말 감사합니다.저도 해봐야겠네요 ^^
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
스케일링 방법 3에서
def 안 만들고 하는 방법은 없을까요??
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
회귀분석, 분산분석 범주형 변수
선생님 안녕하세요, 3유형 공부하다가 궁금한 점이 있어서 질문남깁니다.선형회귀분석에서 독립변수가 범주형일 경우에 원핫인코딩 처리를 안하고, C( )처리를 안해도 자동으로 인코딩이 되는건가요??반면에 anova에서는 꼭 C ( )를 붙여야 범주화변수 처리가 되나요???
-
미해결자바(Java) 알고리즘 문제풀이 입문: 코딩테스트 대비
idle로 실행 질문
지금 인텔리제이로 실행을 해보려고 하고있는데 입력을 어떻게 받아서 써야하는지 감이 안옵니다... 이런상태입니다... 어떻게 하면 될지 알려주시면 감사하겠습니다!!!
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
질문 문제 해결되었습니다.
학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요먼저 유사한 질문이 있었는지 검색해보세요 안녕하세요. 영상에 나온 코드와 함께 보다가 다른 기출 코드 복원 참고 후, 6회 기출 복원 코드 풀이에 대해 질문이 있어 게시글을 남깁니다.1. 영상에 나온 복원 문제1. 연도별로 총 범죄 건수(범죄유형의 총합)의 월평균 값을 구한 후 그 값이 가장 큰 연도를 찾아, 해당 연도의 총 범죄 건수의 월평균 값을 출력하시오. (반올림하여 정수로 출력) 2. 다른 복원 문제2. 다음 월별 범죄를 기록한 데이터로, 연도별 월평균 범죄 건수를 구하고, 가장 범죄가 많이 발생한 연도의 월평균 범죄 건수를 구하시오.6회 복원 문제로 약간 문제가 달라서 그런가 코드가 다르더라고요,,다른 복원 문제 코드로 영상에 나온 데이터로 구했는데 풀이와 값도 달라서어떤식으로 문제의 의미를 해석해서 코드를 작성해야 할지 모르겠습니다. Q. 가장 많이 발생한 건수의 해당 월평균을 구하라는 말은, 많이 나온 년도를 구한 후에 해당 월별 평균 값이 답이 아닌가요? 답변주시면 감사하겠습니다 ㅠ
-
해결됨김영한의 자바 입문 - 코드로 시작하는 자바 첫걸음
intellij run 버튼이 뜨지 않고 공백이 생기는 이유
안녕하세요,강사님을 따라서 intellij를 설치해보았습니다.그러나 run 버튼이 활성화되지 않고 다음과 같이 거대한 공백이 있습니다.줄번호도 없었는데 검색해서 켜봤습니다..그런데 나머지는 뭐라고 검색해야할지 모르겠습니다.어떤 문제일까요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
anova table 문의
학습코드에 따라 아래 코드로 출력하니 검정통계량과 pvalue값이 소수점 2자리까지만 표시됩니다. 혹시 4자리나 그이상 소수점까지 표시하도록 하는 방법은 없나요..?from statsmodels.stats.anova import anova_lm from statsmodels.formula.api import ols model = ols('토마토수 ~ C(종자) + C(비료) + C(종자):C(비료)', data=df).fit() anova_lm(model)