질문 & 답변 - 인프런 | 커뮤니티

묻고 답해요

169만명의 커뮤니티!! 함께 토론해봐요.

인프런 TOP Writers

미해결
R로 배우는 통계

Rstudio 테마 적용하기

rstudio, rtools, r 다운로드까지는 잘 따라했는데Rstudio 테마 적용하기부터 잘 안되고 있습니다.rscode.io 설치하기 따라했는데도 검정 배경이나 글꼴이 적용이 안되고, rscodeio::install_theme() 작성하면 아래와 같이 뜹니다!get_stylesheets_location()에서 다음과 같은 에러가 발생했습니다: Could not find location of your RStudio installation.어떤 점이 문제일까요...?

seolkitty · 2023.10.24 · R로 배우는 통계

투표점수

0

조회수

707

답변

2
미해결
[개정판] 파이썬 머신러닝 완벽 가이드

임곗값에 따른 정밀도-재현율 값 추출

선생님 안녕하세요.임곗값에 다른 정밀도-재현율 추출시, 예측확률 추출(predict_proba)에 대해서 궁금한 점이 있습니다.# predict_proba( ) 반환값의 두번째 컬럼 , 즉 Positive 클래스 컬럼 하나만 추출하여 Binarizer를 적용 pred_proba_1 = pred_proba[:,1].reshape(-1,1)작성해주신 코드는 positive일 확률에 대한 컬럼 하나만 추출한것으로 보이는데, 그 이유가 있을까요?강의를 두세번 반복해서 봐도 이해가 가지않습니다.. 그리고 작성해주신 주석은 'Positive 클래스 컬럼' 이라고 써주셨는데, 데이터를 print해보면 positive 일 확률이기때문에, positive가(1이) 아닐 확률 데이터도 많이 포함되어있어서요. 정확히 어찌 이해하는게 맞을까요?

날치알한판 · 2023.10.09 · [개정판] 파이썬 머신러닝 완벽 가이드

투표점수

0

조회수

225

답변

1
미해결
[개정판] 파이썬 머신러닝 완벽 가이드

feature X 와 target y

feature 표현할 때는 대문자를 써서 X_train 으로 하고target 표현할 때는 소문자를 써서 y_train 으로 작성이 되고 있는데요.대소문자를 구별해서 사용하고 있는 특별한 사유가 있나요?

bi.yang · 2023.10.06 · [개정판] 파이썬 머신러닝 완벽 가이드

투표점수

0

조회수

255

답변

1
미해결
[개정판] 파이썬 머신러닝 완벽 가이드

안녕하세요 강의를 구매해서 잘 듣고있습니다

안녕하세요 강의를 구매해서 잘 듣고있습니다. 혹시 책도 같이 구매를 해야 원활한 학습이 될까요?

박지민 · 2023.10.06 · [개정판] 파이썬 머신러닝 완벽 가이드

투표점수

0

조회수

271

답변

1
미해결
[개정판] 파이썬 머신러닝 완벽 가이드

파이썬 머신러닝 완벽 가이드 개정전 서적

파이썬 머신러닝 완벽가이드 2020버전을 가지고 있습니다2022개정판을 새로 구입해서 강의를 듣는 것이 더 효율적일까요?많이 다르지 않다면 2020년 버전으로 강의를 들어도 문제가 없을지 궁금합니다!!

allmysullem223 · 2023.10.05 · [개정판] 파이썬 머신러닝 완벽 가이드

투표점수

0

조회수

348

답변

1
해결됨
확률과 통계 기초

6.1강의 MGF 간단한 질문입니다

그 MGF의 M_X(s)는 PMF나 PDF랑 다르게 s가 X의 분포를 따르는 Random variable이라는 의미가 아닌거죠? PMF에서 PX(s)는 P(X=s)였었는데 MGF에서는 그렇게 생각하면 안되는게 맞죠? s는 그냥 X와는 별개의 상수인거죠?

허룡 · 2023.09.30 · 확률과 통계 기초

투표점수

0

조회수

411

답변

2
미해결
[개정판] 파이썬 머신러닝 완벽 가이드

범주형 변수 클러스터링

안녕하십니까 교수님 군집화에서 질문이 있어 글을 남기게 되었습니다. 군집화는 거리를 기반하여 유사도를 측정하는 머신러닝 기법이라고 배웠습니다,그럼 카테고리컬 변수의 경우 어떤식으로 클러스터링을 할 수 있을까요?구글링을 해 보니 k-modes라는 것이 있던데.. 연속형 변수와 범주형 변수 데이터를 모두 고려한 클러스터링 방법이 있을까요? 항상 감사합니다.

두니 · 2023.09.28 · [개정판] 파이썬 머신러닝 완벽 가이드

투표점수

0

조회수

823

답변

1
해결됨
확률과 통계 기초

5.2 추가 질문입니다.

41:49초쯤 나오는 Law of Total Expectation식 전개 질문입니다. 빨간 네모박스 친 부분 전개식에서 dxdy를 순서를 바꿔 dy를 먼저 진행한다고 하시는데 제가 수식이 약해서 찾아보니 푸비니 정리에 의해서 이중적분은 보통 dxdy순서를 dydx로 바꿔서 해도 똑같은 결과를 얻는다고 하던데 여기서도 똑같은 맥락에서 dx dy를 순서를 바꿔도 되는건가요? 그리고 제가 생각한 대로 식이 풀리는게 맞나요? x를 상수취급해서 밖으로 빼고 dy적분하는게 맞나 모르겠습니다.

허룡 · 2023.09.25 · 확률과 통계 기초

투표점수

0

조회수

461

답변

2
해결됨
확률과 통계 기초

5.2 단원질문입니다.

23:30초쯤에서 엡실론을 이용해서 확률 계산하는 부분에서 분모에 들어가는 marginal probability식이 헷갈려서 확실히 하려고 질문합니다.빨간 네모 박스 친 부분, 분모가 Y에 대한 marginal probability인데 제가 첨부한 식처럼 X에 대해 먼저 적분해야 하지 않나요? 그래야 Y에 대한 marginal probability 식이 얻어지고, 그 다음에 Y에 대한 적분이 이뤄져야 P(c-epsilon <Y< c+ epsilon)을 얻는게 아닌가요? 근데 수업에서는 Y에 대해서 먼저 적분을 하고 나중에 X에 대해 적분해서 그제서야 Y의 marginal PDF를 구하는 식으로 진행이 되는데 이해가 안됩니다. 수업에서도 순서가 바뀌었다는 뉘앙스로 말씀하시던데 명확하게 이해를 하고싶습니다.분모와 달리 분자의 경우는 X나 Y 교집합(X,Y)이므로 (X∩Y)=(Y∩X)잖아요? 따라서 적분도 마찬가지로 순서가 dxdy 또는 dydx둘중 아무 순서로 진행해도 결과에는 상관이 없을 것이라고 이해하고 있습니다. 그런데 이후 식 전개를 보면 dy를 먼저 적분하지 않으면 전개가 상당히 복잡해질 것 같은데 증명의 편의를 위해 y에 대해 먼저 적분한 것일 뿐, 실제로 순서는 dx와 dy가 바뀌어도 결과에는 영향이 없는게 맞나요?

허룡 · 2023.09.25 · 확률과 통계 기초

투표점수

0

조회수

348

답변

2
미해결
누구나 쉽게 배우는 통계(SPSS보다 쉽게 R)

감사합니다. 또하나 질문 드립니다.

교수님 조언해주신 덕분에 잘해결하였습니다.진심으로 감사드립니다.혹시 다른 질문 하나만 드려도 될까요?Rcmdr에서 logistic regression 을 하려고 하는데 본 질문에 첨부되어있는 사진table 1처럼 multivariate logistic regression 에서 Adult (1)/ pediatric (2)로 나타낼수 있는 방법이 있을까요?고진선처 부탁드립니다!진심으로 감사드립니다!

lorde · 2023.09.24 · 누구나 쉽게 배우는 통계(SPSS보다 쉽게 R)

투표점수

0

조회수

373

답변

1
미해결
[개정판] 파이썬 머신러닝 완벽 가이드

교차 검증 시에 계수나 규칙이 계속 바뀌는건가요?

안녕하세요 교차검증에 대해 잘 이해가 안되서요 ㅠㅠ만약 3번 교차검증을 한다했을 때첫번째 학습을 하고 나서 두번째 학습시에 첫번째 모델을 기반으로 분류라면 분류규칙이라든지 회귀라면 회귀계수가 변경이 된고 셋번째 학습시에 두번째 모델을 기반으로 변경이 계속 되는건가요?

psi1224 · 2023.09.23 · [개정판] 파이썬 머신러닝 완벽 가이드

투표점수

0

조회수

326

답변

1
미해결
확률과 통계 기초

Hypergeometric 기댓값 풀이 중 질문있습니다.

29분50초 부분입니다.dependent Bernoulli(p)라고 생각하고 linearity 이용하는 거면E[X1]= b/(b+r) 이지만, E[X2] 부터는 b/(b+r)이 아니지 않나요? dependent라면 이런 부분을 고려해야 한다고 생각하는데어째서 E[X]가 independent처럼 nb/(b+r)으로 나오는지 궁금합니다.

땅정 · 2023.09.23 · 확률과 통계 기초

투표점수

0

조회수

384

답변

2
해결됨
누구나 쉽게 배우는 통계(SPSS보다 쉽게 R)

열심히 수강중입니다. Rcmdr로

좋은 강의 감사합니다. 열심히 수강중에 있는 학생입니다.강의를통해 다른 통계 분석방법은 잘 배웠습니다.혹시 Rcmdr로 보통의 table 1 Characteristic을 만들 수있는 방법이 있는지 아주 궁금합니다. 확인 부탁드립니다.

lorde · 2023.09.22 · 누구나 쉽게 배우는 통계(SPSS보다 쉽게 R)

투표점수

0

조회수

298

답변

1
미해결
[개정판] 파이썬 머신러닝 완벽 가이드

gridsearchcv관련 간단한 질문이 있습니다.

안녕하십니까, 많이 배우고 있습니다.질문 : GridSearchCV의 경우 k-fold만 사용 하는 것 같은데, stratified k-fold는 사용할 수 없나요? 아래는 chat gpt가 stratified k-fold 사용법을 알려줬는데 아래와 같이 사용하면 되는지 여쭙습니다. from sklearn.model_selection import StratifiedKFold, GridSearchCV from sklearn.svm import SVC # 예제 데이터와 모델 X, y = load_your_data() # 데이터를 로드하거나 생성하는 코드 model = SVC() # 사용할 모델 # Stratified K-Fold 교차 검증 설정 stratified_kfold = StratifiedKFold(n_splits=5, shuffle=True, random_state=42) # 그리드 서치 설정 param_grid = { 'C': [0.1, 1, 10], 'kernel': ['linear', 'rbf'] } grid_search = GridSearchCV(estimator=model, param_grid=param_grid, cv=stratified_kfold) # 그리드 서치 수행 grid_search.fit(X, y) # 최적의 매개변수와 결과 출력 print("Best parameters found: ", grid_search.best_params_) print("Best cross-validation score: {:.2f}".format(grid_search.best_score_)) 위 코드에서는 StratifiedKFold를 GridSearchCV의 cv 매개변수에 전달하여 Stratified K-Fold 교차 검증을 수행하고 있습니다. 따라서 그리드 서치는 Stratified K-Fold 교차 검증을 사용하여 모델의 성능을 평가합니다. StratifiedKFold의 n_splits 매개변수는 원하는 폴드 수를 지정할 수 있습니다.이렇게 하면 그리드 서치를 Stratified K-Fold 교차 검증과 함께 사용하여 클래스 간 분포를 고려한 모델 평가를 수행할 수 있습니다.

JAEHO KWON · 2023.09.18 · [개정판] 파이썬 머신러닝 완벽 가이드

투표점수

0

조회수

486

답변

1
미해결
[개정판] 파이썬 머신러닝 완벽 가이드

uci human activity recognition dataset 에 대한 내용

강사님 안녕하세요! 이제 막 강의를 듣기 시작한 학생입니다. 다름이 아니라 Human Activity Recognition Using Smartphones - UCI Machine Learning Repository이 사이트가 바뀌어서 dataset를 어디서 다운 받을지 모르겠습니다 어디로 가야할지 알려주실 수 있나요 ?

최연우 · 2023.09.17 · [개정판] 파이썬 머신러닝 완벽 가이드

투표점수

0

조회수

699

답변

1
해결됨
[개정판] 파이썬 머신러닝 완벽 가이드

GridSearchCV 질문 드립니다!

GridSearchCV의 best_score_ method를 이용하면 교차검증을 통해 최적의 하이퍼파라미터 조합을 찾아서 가장 높은 score를 반환하는 것으로 알고 있습니다. 다만 여기서 scoring 하이퍼파라미터 설정을 안한다면 반환되는 best_score_는 무엇이 되는건가요? accuracy가 디폴트인가요? best_score_floatMean cross-validated score of the best_estimatorFor multi-metric evaluation, this is present only if refit is specified.This attribute is not available if refit is a function. 공식문서에서는 이렇게 나오는데, 여기에서도 score를 어떻게 정의하는지에 대해 구체적으로 나와있지 않았습니다. GridSearchCV를 사용하는데 있어서, 디폴트로 반환하는 .best_score_값이 무엇인지 정확히 무엇인지 궁금합니다! 긴 글 읽어주셔서 감사합니다 :) 오늘도 좋은 하루 보내시길 바랍니다!

맹고 · 2023.09.15 · [개정판] 파이썬 머신러닝 완벽 가이드

투표점수

0

조회수

396

답변

1
미해결
R로 배우는 통계

강의자료

강의 자료는 어디서 다운 받을 수 있을까요? 홈페이지는 사이트가 없다고 뜨고, 유투브의 슬랙도 가입을 했는데 자료가 없네요.

주희 · 2023.09.12 · R로 배우는 통계

투표점수

0

조회수

396

답변

2
해결됨
[개정판] 파이썬 머신러닝 완벽 가이드

random_state에 관해 질문드립니다

일반적으로 train_test_split() 함수에 random_state를 지정하는 이유는 학습 데이터셋과 테스트 데이터셋을 분리할 때 매 수행마다 동일한 데이터셋으로 분리하기 위함이라고 알고 있습니다. 그런데 DecisionTreeClassifier()객체를 생성할 때 안에 random_state를 넣어주는 이유는 무엇인가요? DeicisonTreeClassifier과 train_test_split() 둘다 random_state를 넣어줘야 하나요? 만약 그렇다면 radom_state가 각각 사용되는 의미가 다른가요? 다르다면 어떻게 다른지 여쭙고 싶습니다. 선생님, 날씨도 더운데 답변해주시느라 너무 감사합니다ㅜㅜ

맹고 · 2023.09.11 · [개정판] 파이썬 머신러닝 완벽 가이드

투표점수

0

조회수

902

답변

1
미해결
[개정판] 파이썬 머신러닝 완벽 가이드

폴드의 갯수

선생님 안녕하세요k-폴드 방식으로 데이터를 분할할 때, 최적의 k는 어떻게 구하나요?

data_buddha · 2023.09.08 · [개정판] 파이썬 머신러닝 완벽 가이드

투표점수

0

조회수

341

답변

1
미해결
확률과 통계 기초

1.3 example1 풀이

사건 A,B가 일어날 확률인 P(A) = 0.6, P(B) = 0.7 일 때1번 답은 exclusion-inclusion principle에 의해 P(A)+P(B)-P(A)*P(B) = 0.882번 답은 단순 교집합으로 P(A)*P(B) = 0.6*0.7 = 0.423번 답은 (P(A)-P(B) ) + (P(B) - P(A)) = (0.6 - 0.42) + (0.7 - 0.42) = 0.18 + 0.28 = 0.46이 아닌가 해서 질문 남깁니다!또, P(A^c)*P(B^c) = 0.4 * 0.3 = 0.12이 아닌가 싶어서요.

정한울 · 2023.09.05 · 확률과 통계 기초

투표점수

0

조회수

306

답변

2

인기 태그

주간 인기글