묻고 답해요
167만명의 커뮤니티!! 함께 토론해봐요.
인프런 TOP Writers
-
미해결[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
기초통계 확인에서 왜도 확인 의도가 궁금해요
안녕하세요!전처리 과정 중 describe()로 기초통계를 확인할 때 mean, median 값을 활용해 왜도를 확인하시더라구요. 데이터의 치우침 정도를 그냥 확인만 하는 건가요 아니면 그에 대한 다른 처리를 해야 하나요? 영상에서는 확인만 하셨던 것 같은데, 여러번 언급하시는 것을 보니 중요한 내용 같아서 여쭤봅니다.
-
미해결[리뉴얼] 처음하는 파이썬 데이터 분석 (쉽게! 전처리, pandas, 시각화 전과정 익히기) [데이터분석/과학 Part1]
json.dumps관련된 질문
json.dumps를 사용할때 안에 사전형 데이터가 두개 있는데 왜 "language":{"Java":"basic", "Java":"advance"}출력값은 "language": { "Java": "advance" }, 이렇게만 나오나요?
-
미해결실리콘밸리 데이터 리더가 알려주는 Airflow 기초
이전 강의에서도 그랬지만 소리가 너무 작아요
강의의 절대 소리가 작아서, 휴대폰(갤럭시 S24) 기준으로 최대 볼륨으로 올려도 만족스러울만큼 크지가 않습니다. 또한 다른 애플리케이션에서 나오는 소리와 차이가 커서 볼륨을 계속 변경해줘야 해요. 이미 찍은 강의에서 이를 개선해주실 수 있을진 모르겠지만, 불편하다는 점 인지해주시면 감사하겠습니다.
-
미해결[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
원핫 인코딩 후 열 불일치 방지
아래처럼 원 핫 인코딩 한후 에 열 불일치 맞춤으로 아래와 같이 해도 되나요?train, test = train.align(test, axis=1, join='left', fill_value=0)
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
파일 다운로드
학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요먼저 유사한 질문이 있었는지 검색해보세요수업노트에 파일이 있다고 하는데 어디에 있는지 못찾겠어요..ㅠ
-
미해결[리뉴얼] 처음하는 파이썬 데이터 분석 (쉽게! 전처리, pandas, 시각화 전과정 익히기) [데이터분석/과학 Part1]
빅분기대비
빅분기를 준비하려고 하는데요. 실기 시험이며 이 수업과 머신러닝 수업만 듣고 합격에 대한 안정적인 실력으로 만들 수 있을까요?.
-
미해결프로그래밍 시작하기 : 파이썬 입문 (Inflearn Original)
강의 예제문서 & 예제파일 전달 부탁드립니다.
예제파일 다운로드가 안됩니다. kk2408240@naver.com으로 예제파일 전달 부탁드립니다.
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
python.ipynb 파일 어떻게 복사하나요..?
학습 하기 위한 노트북 복사하려고 하는데 어떻게 복사해오는지 모르겠어요..
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
결측치 수 관련 질문있습니다!
학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요먼저 유사한 질문이 있었는지 검색해보세요len(df)자체가 결측치의 값의 수를 가르키나요?? len(df)는 결측치를 포함한 전체 값의 수 아닌가요....?????이전 코드에서 보면 df는 그냥 파일 경로 지정할때만 쓴 변수 아닌가요...??# your code import pandas as pd df = pd.read_csv("https://raw.githubusercontent.com/lovedlim/inf/main/p1/members.csv") print(df.isnull().sum()) print(len(df) * 0.3)
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
3회 기출유형 작업형 2 관련 질문
학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요먼저 유사한 질문이 있었는지 검색해보세요import pandas as pd import numpy as np from sklearn.preprocessing import LabelEncoder from sklearn.preprocessing import MinMaxScaler from sklearn.model_selection import train_test_split from sklearn.ensemble import RandomForestClassifier from sklearn.metrics import roc_auc_score, f1_score, accuracy_score import sklearn XY = pd.read_csv("https://raw.githubusercontent.com/lovedlim/inf/refs/heads/main/p4/3_2/train.csv") X_result = pd.read_csv("https://raw.githubusercontent.com/lovedlim/inf/refs/heads/main/p4/3_2/test.csv") #Employment Type, GraduateOrNot, FrequentFlyer,EverTravelledAbroad X = XY.drop(columns = ['TravelInsurance']) Y = XY['TravelInsurance'] total_X = pd.concat([X, X_result], axis = 0) total_X['Employment Type'] = LabelEncoder().fit_transform(total_X['Employment Type'].astype(str)) total_X['GraduateOrNot'] = LabelEncoder().fit_transform(total_X['GraduateOrNot'].astype(str)) total_X['FrequentFlyer'] = LabelEncoder().fit_transform(total_X['FrequentFlyer'].astype(str)) total_X['EverTravelledAbroad'] = LabelEncoder().fit_transform(total_X['EverTravelledAbroad'].astype(str)) X = total_X.iloc[:len(X),:] X_result = total_X.iloc[len(X):,:] x_train, x_test, y_train, y_test = train_test_split(X, Y, test_size = 0.2, random_state = 111) model = RandomForestClassifier() model.fit(x_train, y_train) y_pred = model.predict(x_test) roc_auc = roc_auc_score(y_pred, y_test) f1 = f1_score(y_pred, y_test) acc = accuracy_score(y_pred, y_test) y_pred_result = model.predict(X_result) pd.DataFrame({'index':X_result.index,'y_pred':y_pred_result}).to_csv('0000.csv', index = False) print(pd.read_csv('0000.csv'))안녕하세요, 혹시 이것도 답안으로 제출이 가능할지 한번 봐주실수있나요??
-
미해결Airflow 마스터 클래스
에어플로우 일부 작동 비정상
안녕하세요. 강사님 현재 저는 mac 기반이며,airflow 을 띄우는데는 성공하였습니다. dag으로 들어가, 실행까지는 잘 되는데 그 후 코드나 그래프를 확인하려면 무한로딩만 되어내용을 볼수없는 상황입니다.문제가 되는 화면인데, 혹시 몰라 docker ps 로 입력 시 일부 몇개가 unhealthy 하게 나오는것을 확인하였는데, 이 부분과 문제가 있을까요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
[customerID] 와 'customerID' 차이
둘 다 csv 파일인데, 하나는 작은따옴표로 묶고 다른 하나는 대괄호로 묶는 이유가 궁금해요train = train.drop('customerID', axis = 1) test = test.drop([customerID], axis = 1)
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
제2유형 질문
제2유형에서df.isnull().sum()으로 결측값나올까요? 기출문제 풀어보는데 한번도 결측값채우는건안나온거같은데 미리 준비하는건가요아님 기출에서 진짜 안나온게맞는건가요
-
미해결[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
작업형3 질문
카이제곱이나 로지스틱회귀 같은건 어디서보나요??
-
미해결비개발자도 쉽게 시작하는 코딩 입문 강의: PCCE 합격을 위한 파이썬 기초 & 알고리즘
4-1. 다양한 형태의 제어문-실습문제28. 질문
안녕하세요강사님의 풀이는 이해가 됐는데요. for j in range(5-i):이것의 결과값이 5, 4, 3, 2, 1 이면# for j in range(5,0,-1)이렇게 진행해도 동일한 결과값이 나옵니다.그런데 run하면*************************이렇게 나옵니다. 무슨 차이가 있을까요??
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
작업현 제2유형 한번에 풀기
선생님, 제가 아래와 같이 로직을 구현해서 저걸로 뺑뺑이 돌리면서 연습하고있는데요. 궁금한건 답이랑 차이가 조금 나는데범위안에 들어오면 문제없는건가요? 정답과 일부차이가 나는경우, 오답으로 인정하는 부분인지 아니면 부분점수로 정리되는건가요 예를들어, 40점 만점에서 범위가 초과하면 37 / 35점 이렇게 받는기준인가요? 일단 제2유형은 만점받고 가는 개념이라 우려스러워서 문의드립니다. import pandas as pd train = pd.read_csv("https://raw.githubusercontent.com/lovedlim/inf/refs/heads/main/p4/6_2/energy_train.csv") test = pd.read_csv("https://raw.githubusercontent.com/lovedlim/inf/refs/heads/main/p4/6_2/energy_test.csv") # train.info() # test.info() target = train.pop('Heat_Load') train = pd.get_dummies(train) test = pd.get_dummies(test) train, test = train.align(test, join='left', axis=1) from sklearn.model_selection import train_test_split x_tr, x_val, y_tr, y_val = train_test_split(train, target, test_size=0.2, random_state=0) from sklearn.ensemble import RandomForestClassifier rf = RandomForestClassifier(random_state=0) rf.fit(x_tr, y_tr) pred = rf.predict(test) submit = pd.DataFrame({'pred':pred}) submit.to_csv('result.csv', index=False) ans = pd.read_csv('result.csv') print(ans)
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
실기 환경 단축키
안녕하세요 선생님 혹시 실기체험에서 해보니깐 단축키가 안먹히던데실기시험장에서는 단축키를 쓸 수 없나요?? (shift+enter, ctrl+/) 그리고 실기시험장에서는 캐글이나 코랩처럼실행셀 바로 밑에 예쁘게 표나 문구로 나오는게 아니고 맨밑에 실행결과에 안예쁘게 나오는거 맞죠..??
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
캐글 T1-11
안녕하세요 선생님캐글 T1-11부터 갑자기 코드 실행이 안됩니다. t-10까지는 셀?도 나눠져 있고 실행이 잘되는데 t-11부터 갑자기 셀이 한개이면서 실행도 안됩니다.. 코드 추가 버튼도 없고..어떻게 해야 되나요??
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
작업형1 시계열데이터
안녕하세요 저는교재랑 같이구입해서 공부하는 중입니다.시계열데이터에 대해서 강의내용은 다 학습을 했는데 교재에는 시계열데이터 관련해서 더 많은내용이 있더라구요,,,근데 너무 어려워서 ..지금시험이 20일정도 남은 시점에서 이내용까지 공부해서 완벽하게 익혀야하는지 의문이 들어서요교재 섹션26부터는 대부분 조건문이 2개 이상 넣어서 풀어야하는 문제인데 저는 이번에 파이썬을 처음 접해서.. 응용이 힘드네요기출문제를 봤을때 아직 시계열은 많이 안나왔던데 그래서 고민이 좀 되구요..시계열데이터에서 어디까지 공부해야하는지 조언부탁드립니다.
-
미해결[Level 2] Qt를 이용한 Python 프로그래밍: QML편
parent.width 관련 질문.
안녕하세요! 강의를 보던 중 질문이 있습니다! Window {width:400; height:112}라고 했을 때.Rectangle에서도 parent.width를 써도 되지 않나요?? 안쓰는 이유가 있는지 궁금해서 문의 드립니다!