묻고 답해요
169만명의 커뮤니티!! 함께 토론해봐요.
인프런 TOP Writers
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
섹션 16-3 7회 기출 유형 작업형3 문제1-2에서 glm 대신 logit을 사용해도 되나요?
glm 대신 logit을 사용해도 되나요? 아래와 같이 입력하면 model. summary 결과에 deviance 값이 없는데, 문제에서 로지스틱 회귀 모델을 적합시키라고 했는데 어떨때는 logit을 사용하고, 어떨때는 glm을 사용해야 하는지 모르겠습니다!from statsmodels.formula.api import logit model = logit("gender ~ age + length + diameter + height + weight", data = train).fit() model.summary()
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
작업형2 모의문제2 : R2 SCORE / ID 삭제
학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요먼저 유사한 질문이 있었는지 검색해보세요 안녕하세요~작업형2 모의문제2 : 에어비엔비 가격예측에서 2가지 질문드립니다. 작업형2 모의문제1에서는 CLIENTNUM로 인해서 과대적합 가능성이 있다고했는데 이번에는 id는 남겨놓고 host,name 등만 삭제하셨더라구요. 이번엔 ID를 남겨놓은 이유가 있을까요? R2 score 값이 1에 가까울수록 좋은 모델이라고 알고 있었습니다. 질문을 찾아보니 모델 점수에 연연하지 말라고 하셨는데, 그래도 R2 SCORE값이 -값이 나오거나 0.01 정도로 나오면 시험볼 때 많이 불안할 것 같더라구요.. - 값이나 0.01 정도로 나와도 괜찮은 건가요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
캐글- 작업형3 updated 2023.11에서 독립성 검정 문제
Chi2ContingencyResult(statistic=5.929494712103407, pvalue=0.01488951060599475, dof=1, expected_freq=array([[115., 115.], [185., 185.]]))다음과 같이 결과가 나오는데, 여기서 expected_freq=array(남자의 합격 기대빈도(115), 남자의 불합격 기대빈도(115), 여자의 합격 기대빈도(185), 여자의 불합격 기대빈도(185))이 순서가 맞나요??
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
대응표본검정 강의 6:35초 문의
안녕하세요! 대응표본검정 강의 6:35초 부분에서윌콕슨 검정 alternative를 대립가설 기준으로 봐야한다고 말씀하신 이유가,샤피로-윌크 검정에서 대립가설을 따른다고 결론이 났기 때문인가요? 감사합니다.
-
미해결15일간의 빅데이터 파일럿 프로젝트
FileZilla 권한 거부
강사님하신대로 빠른연결하면 home/bigdata가 아닌 /로 들어가지고 home을 눌러서 bigdata로 들어가려해도 권한 수정되어있는데 제가 뭔가 빠뜨린건가요?bigdata 권한 수정해주면 될 것 같긴한데 추후에 문제가 생길까봐 문의드립니다.
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
작업형 2 모의문제 1에서 랜덤포레스트 후 실행하는 데 자꾸 저런 오류가 뜹니다.
학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요먼저 유사한 질문이 있었는지 검색해보세요작업형 2 모의문제 1에서 랜덤포레스트 후 실행하는 데 자꾸 저런 오류가 뜹니다. 어떻게 해야 하나요??
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
노트북&데이터 자료 일괄 다운로드 방법 문의
안녕하세요 🙂 수업자료 ipynb와 data파일을 일괄적으로 다운받을 수 있는 방법이 있을까요? 확인 부탁드립니다!
-
미해결빅데이터/텍스트마이닝 분석법 (LDA,BERTtopic,감성분석,CONCOR with ChatGPT)
LDAvis 시각화가 안됩니다.
사진과 같이 오류가 계속 뜹니다... 어떻게 하면 좋을까요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
선언문에 대한 질문
수업을 듣다보면 함수나 모델이나 이런것들을 가져올때 nump, sklearn, sklearn.preprocessing 등...그리고 import 해오는 것들이 어디에 속해있는 것인지? 이런 것들이 외우려니 좀 많이 혼동이 되서 잘 안외어져서 질문드립니다. 시험장에서 좀더 효율적으로 잘 기억나게 하는 방법이 있는지요?아니면 나올때 마다 다 외워야하는지요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
컬럼 선택
학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요먼저 유사한 질문이 있었는지 검색해보세요 둘 중 어느방법을 써도 무방할까요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
검증
학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요먼저 유사한 질문이 있었는지 검색해보세요실제 시험장에서 검증단계가 꼭 필요한가요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
6회 작업형 3유형 카이제곱 검정 List 값 문의
ob = df.value_counts(normalize=True).sort_index() ob = ob.to_list() ex = [0.1, 0.05, 0.15, 0.7]즉, 관찰값과 기댓값을 비율로 입력하여관찰값 [0.2, 0.15, 0.1, 0.55]기댓값 [0.1, 0.05, 0.15, 0.7] 으로 비교하면 안되나요?비율은 같은데 통계량과 P-value 가 다르게 나오네요.
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
원핫인코딩
원핫인코딩 하니 0,1이 아닌 True, False로 결과가 나왔습니다.수치결과가 다르지는 않았어서 큰 문제는 아닌것같은데, 0,1,로 나타낼 방법은 없을까요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
LinearRegression, LogisticRegression 쓸 때
/usr/local/lib/python3.10/dist-packages/sklearn/linear_model/_logistic.py:458: ConvergenceWarning: lbfgs failed to converge (status=1): STOP: TOTAL NO. of ITERATIONS REACHED LIMIT. Increase the number of iterations (max_iter) or scale the data as shown in: https://scikit-learn.org/stable/modules/preprocessing.html Please also refer to the documentation for alternative solver options: https://scikit-learn.org/stable/modules/linear_model.html#logistic-regression n_iter_i = checkoptimize_result( 계속 이 문구가 뜨는데, 문제가 있는 걸까요??
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
질문이 있습니다~~
기출2회를 풀고 있는데요주어진 데이터셋(members.csv)의 앞에서부터 순서대로 80% 데이터만 활용해 'f1'컬럼 결측치를 중앙값으로 채우기 전 후의 표준편차를 구하고, 두 표준편차 차이 계산하기 (단, 표본표준편차 기준, 두 표준편차 차이는 절대값으로 계산) 이 문제를 시험환경에서 풀면len(df)*0.8 df = df.iloc[:80] df before = df['f1'].std() median1 = df['f1'].median() # 20.574853076621935 import numpy as np df['f1'] = df['f1'].fillna(median1) after = df['f1'].std() # 17.010788646613268 이게 한 창 안에서 한번에 코딩이 되면서before과 after 둘다에 17.010 어쩌고가 들어가서print(before-after) 을 하면 0이 되더라고요 실행은 한 코딩창 안에서 진행해야 하는데그럼 숫자를 따로 저장해서 20.574 - 17.010 을 출력해야 하나요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
2 유형 평가 방식
안녕하세요첫 실기 준비이다 보니 궁금한게 너무 많네요 ㅠㅠ 2유형 평가는 순수하게 제출된 csv 파일로만 평가되나요?아니면 풀이한 코드까지 평가 대상인가요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
[작업형2] 머신러닝 및 평가지표-모델링 및 평가(회귀)
안녕하세요, [작업형2] 머신러닝 및 평가지표-모델링 및 평가(회귀) 강의에서결과값을 예측하는거에 대해 회귀분석이니 y값을 예측하는거고.. 이 하나의 값은 무엇을 의미하나요 ??평가방식이 RMSE이니 charges의 평균의 루트를 씌운값일까요 ??
-
미해결빅데이터/텍스트마이닝 분석법 (LDA,BERTtopic,감성분석,CONCOR with ChatGPT)
강의 자료
안녕하세요. 강의 때 들었던 내용을 자료를 보면서 빠르게 복습하고 싶은데 자료를 어디서 받을 수 있는지 모르겠습니다. 혹시 따로 올려주신 자료가 없다면 강의자료 및 사용되는 프롬프트(및 코드) 업로드 부탁드립니다.
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
라벨 인코딩 질문 드립니다.
안녕하세요라벨인코딩 질문드립니다. 피처 엔지니어링 > 라벨인코딩 강의 부분 중에LabelEncoder 를 le 라는 변수에 선언하고,이후에 반복문 안에서 한 번 더 le 라는 변수에 encoder 를 다시 할당(?) 해주는데 뭔가 초기화(?) 같은 역할을 해줘야하는건가요?아니면 반복문 안에 le = encoder() 부분은 생략해도 무방한가요? le = LabelEncoder() for col in cols: le = LabelEncoder() # 이 부분이 꼭 들어가야하나요? X_train[col] = encoder.fit_transform(X_train[col]) X_test[col] = encoder.transform(X_test[col])
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
성능평가 이해가 안되는 부분이 있습니다!
다른분들이 질문남긴거에 답변 달아주신걸 봐도 아직 이해가 안되는 부분이 있습니다.<작업형2 모의문제 3 수업노트 중> y_test 파일의 최종 결과파일의 데이터는 0 아니면 1인 이진분류인데,predict_proba로 제출한 값은 확률값인데,이 부분 확률로 제출하는게 괜찮다고 설명해 주신 부분을 보았는데도 아직 명확하게 이해가 되지 않습니다. 이 성능평가에 대한 부분을 어떻게 이해하면 될까요?