묻고 답해요
158만명의 커뮤니티!! 함께 토론해봐요.
인프런 TOP Writers
-
미해결
dropna 방법2가지 차이
1. df = df.dropna() df.dropna(inplace=True) 차이와 시험환경에서는 어떤걸로 외워서 쓰는게 나은지 알려주세요. 특정컬럼에 결측치가 있는경우 해당 행 제거는df = df.dropna(subset=['f1']) 로 풀이되어있긴한데 df = df['f1'].dropna 를 하면 안되는 이유가 있을까요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
작업형3 일부 문의
단순 선형회귀 분석에서 잔차를 구할때 잔차 = df[종속변수] - model.predict(df['독립변수]) 이렇게 구하는데, 다중선형 회귀분석에서 구하는 방식인 model.resid 으로 구해도 되는지 문의드립니다. 잔차제곱 평균을 mse라고 할때 mse = (model.resid **2).mean()으로 구하는데, 마인드맵에서 잔차의 평균제곱오차 (MSE) = model.mse_resid로 나타나있는데 두 개의 값이 다르게 나오는데 혹시 다르게 나오는 이유를 알려주시면 감사하겠습니다! 작업형3 회귀분석 관련 범주형 변수일때 원핫 인코딩을 적용하게 되면 숫자로 안바뀌고 True,False로 값이 뜨는데, 이유와 어떻게 숫자로 바꿀수 있는지 알려주시면 감사하겠습니다!
-
해결됨[임베디드 입문용] 임베디드 개발은 실제로 이렇게 해요.
온도센서
온도센서 PA2로 연결했는데, Temperature값을 전혀 가져오지못하고있어서 문의드립니다. 다른쪽 코드는 완성본을 붙여봐도 온도값을 못가져옵니다. 아두이노로 테스트했을때는 정상적으로 온도값을 가져오는것을 확인했는데 온도값을 못가져와 마무리가안돼서 문의드려요..
-
미해결호돌맨의 요절복통 개발쇼 (SpringBoot, Vue.JS, AWS)
깃헙 collaboator 초대 관련
당연히 구글링 해보셨져? 원하는 결과를 못찾으셨나요? 어떤 검색어를 입력했는지 알려주세문제가 발생한 코드(프로젝트)를 Github에 올리시고 링크를 알려주세요.안녕하세요 호돌맨님.덕분에 강의 잘 듣고있습니다.깃헙 collaboator로 초대받을 수 있을까요?깃헙 아이디는 dudfo6425@gmail.com 입니다!감사합니다.
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
기출 5회 pred값이 선생님 결과랑 달라요
학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요먼저 유사한 질문이 있었는지 검색해보세요 pred1 15586.882 15407.713 14912.474 18482.735 6168.016 16953.75 기출 5회 정답파일 제출 Value값인 pred가 책이랑 다른데, 이럴수가 있나요? 제출한다면 선생님꺼랑 똑같은 인덱스에 똑같은 pred값이 들어갔어야할텐데,,, random_state도 똑같이 전부 0으로 맞췄는데 이럴수가 있나요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
작업형3 로지스틱 회귀분석
강의서에서 잔차이탈도는 model = glm(formula, data=데이터, family=sm.families.Binomial()).fit()이렇게 구하는것으로 나와있는데, 작업형3 마인드맵 자료 주신거에는로그우도 : model.lif잔차이탈도 : -2 * model.lif이렇게 되어 있는데,로그우도, 잔차이탈도 모두 logit summary에서도 확인할 수 있는것인지 궁금합니다!
-
미해결시스템 디자인 첫걸음: 면접에서 돋보이는 백엔드 아키텍처 설계하기
멱등성. '같은 요청'의 기준?
같은 요청이 여러 번 들어와도 한 번만 처리하는 것. 여러 번의 요청이 들어왔을 때 이 요청이 '같은 요청' 이라는 것을 정확하게 판단할 수가 있을까요?예를 들어 똑같은 점포의 똑같은 POS에서 똑같은 액수의 포인트 적립/사용이 두 번 들어왔을 때,이 두 요청이 각자 다른 요청인지? 클라이언트 단의 문제로 인해 같은 요청을 두 번 보낸 것인지? 정확하게 판단할 수 있는 걸까요?두 요청의 도착 시간 간격이 매우 짧을 때-> 일반적인 상황에서 같은 동작이라고 판단할 수야 있겠지만.. 매우 빠르게 요청을 계속해서 받아야 하는 상황이라면?도메인 특성에 따라 같은 요청임을 판단할 수 있는 기준이나 상황이 달라지기야 하겠지만 정확하게 보장 받을 수 있는 기준은 존재하기 어렵지 않나 하는 생각이 듭니다.실제 사례를 통해 예시를 들어주실 수 있는 게 있을까요?
-
미해결10주완성 C++ 코딩테스트 | 알고리즘 코딩테스트
3-A 질문드립니다!
안녕하세요 문제를 풀었는데 오답이 나와서 질문드려요http://boj.kr/2cfae2c4629946ce8da516639d668b86추가로 987654321 로 정하신 것도 그냥 크게 정하신거 같은데 혹시 정확한 범위 알 수 있을까요 ?
-
미해결
유형1 print 로 한번에 작성해도 되는지?
df = df['f4'].value_counts() print(df.index[0]) 이렇게 풀이해주셨는데 이렇게 한줄로 써도 결과는 동일하긴한데, 유형1 실제 시험에서 한줄로 작성을 해도 되는건지 궁금합니다.print(df['f4'].value_counts().index[0])
-
해결됨Flutter 초입문 왕초보편
섹션3. 비만도계산기 문자열 입력가능 오류 관련
비만도 계산기 소스코드 작성중 null이나 빈값(empty)관련 예외처리는 있었으나, 문자열 관련 입력을 받을 수 없도록 하는 처리는 따로 없었던 것 같습니다.아마도 키보드 타입을 number로 제한을 두셨기 때문이었을 것이라 생각되는데요.입력폼에다가 커서를 둔 상태로 한영키(맥북에서 캡스락)을 누르면 문자열이 입력되는 것을 확인할 수 있었습니다.입력된 문자열이 있는 상태로 결과버튼을 누르면 빨간 에러화면(?) 같은 것을 확인 할 수 있었는데요.아래 사항들이 궁금하여 문의드립니다.자세한 사항은 아래 첨부된 세개의 이미지 참조 부탁드립니다. 빨간화면이 어떤 에러가 발생할 때 주로 뜨는 것인지?? (웹에서 404에러가 페이지를 표시할 수 없음화면이라던가... 그런 어떤 특정 오류 타입이 있는지 궁금하네요)맥os에서만 발생하는 오류인지, 윈도우os에서도 발생할 수 있는 오류인지??해당 오류를 완전히 막을 수 있는 방법이 있다면?? (string을 완전히 막아야 할까요??) 이미지가 한줄로 나열되지 않네요...
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
작업형3 마인드맵 로지스틱 회귀분석
작업형3 마인드맵 올려주신것 중에서 로지스틱 회귀분석 관련오즈비에 대한 설명은 작업형3 예시 문제 강의에서 확인가능한데,나머지 (오류율,AIC/BIC,잔차,로그우도 등) 부분에 대한 설명은 현재 강의에서 볼 수 없는데설명해주시는 강의가 따로 있을까요??!^^
-
미해결3세대 영어: 말문 트이는 실전 문법 클래스
작문 피드백 페이지 오류 작동 안하는 이슈
샘, 작문피드백클릭하면 구글 api오류 404 문제로 스크립트 관련 피드백 페이지 오류 발생하는 부분 확인 부탁드립니다.감사합니다.
-
미해결ElasticSearch Essential
하루 100GB 로그를 30기간 저장하는 클러스터 예시중 질문이 있습니다.
안녕하세요.오픈서치 샤드와 노드 구성 관련해서 질문이 있는데요,강의에서 말씀해주신 예시를 다시 계산해보니 뭔가 안 맞는 것 같아서요.하루 100GB 로그, 30일 보관, 레플리카 1로 설정했을 때전체 저장공간: 6,000GB인덱스별 샤드 최대 크기: 10GB데이터 노드: 10개노드당 가져야 할 디스크 크기 : 600GB이렇게 계산하셨는데, 결국에는 인덱스별 프라이머리 샤드개수가 10개고, replica까지 포함하면 20개니까 실제로는 노드 하나에 샤드 2개(프라이머리+레플리카)씩 들어가고 각 샤드 최대 크기가 10GB라면 노드당 최대 20GB밖에 저장이 안 되는 거 아닌가요?그럼 하루에 600GB를 저장하려면 샤드 1개당 최대크기가 최소 300GB는 되어야 할 것 같은데... 제가 잘못 이해한 건지 확인 부탁드립니다
-
미해결파이썬 알고리즘 트레이딩 파트1: 알고리즘 트레이딩을 위한 파이썬 데이터 분석
local 환경에서 수업을 진행해도 무리가 없을까요?
local 사양이 괜찮은 편이여서 그대로 진행하려고 합니다. 괜찮을련지요? 기존에 수업을 듣다가 프로그래밍에 관심이 생겨서, C언어 기본, C++ 자료구조 및 알고리즘을 제대로 학습한 후에 돌아왔습니다. 다시 수강해보겠습니다~
-
해결됨(2025) 일주일만에 합격하는 정보처리기사 실기
2025 년 1회 구조체와연결리스트 문제누락
5페이지 구조체와연결리스트 해설 누락된것같습니다.
-
미해결죽음의 Spring Batch: 새벽 3시의 처절한 공포는 이제 끝이다.
FaultTolerant의 retryLimit() 횟수 질문
킬구형 안녕, Fault Tolerant 쪽에서,retryLimit()을 설명해줄 때만약 retryLimit 값이 3일경우, "첫번째 호출시도 1번, 재시도 호출 2번"으로 총 3번이 호출된다고 했잖아.재시도 횟수는 항상 retryLimit - 1 이라 그랬고. 근데 왜 "ItemProcessor의 예외 발생 시 재시도 - 아이템 단위로 재시도 관리"의 마지막 호출 결과 찍어준 부분에서, retryLimit()은 3인데 왜 ItemProcessor는 4번이 호출되는거야?위에 설명한대로라면 3번만 호출되어야 하는거 아냐?
-
미해결
fillna 방식 문의
안녕하세요. 빅분기 교재를 구입해서 연습문제를 풀어보고있는데요p164df['view'].fillna(min,inplace=True) 라고 풀이에 되어있는데결측치를 원본에서 직접수정하는 코드라 그런건지코랩에서 오류가 나기도 하고 이 문장 대신 시험에서df['view'] = df['view'].fillna(min)으로 써도 무방한건지 궁금합니다.
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
시험환경test 제2유형
강사님 안녕하세요.강사님께서 말씀해주신 랜포 + train, test = train.align(test, join='left', axis=1) 하고나서에러메시지가 뜨길래 추가적인 fillna(0)를 해주고, 아래와 같이 작성했는데요 문제에서 제시한 예시와 제 답안의 수치가 너무 차이가 많이납니다.어떤부분이 문제일까요? ㅜ_ㅠ 확인 부탁드립니다.isnull 에 무조건 0채우라고해서 fillna(0)한거밖에 차이가 없습니다. import pandas as pdtrain = pd.read_csv("data/customer_train.csv")test = pd.read_csv("data/customer_test.csv")# print(train.info())# print(test.info())train = train.fillna(0)test = test.fillna(0)# df.isnull().sum()target = train.pop('총구매액')train = pd.get_dummies(train)test = pd.get_dummies(test)train, test = train.align(test, join='left', axis=1)train = train.fillna(0)test = test.fillna(0)from sklearn.model_selection import train_test_splitx_tr, x_val, y_tr, y_val = train_test_split(train, target, test_size=0.2, random_state=0)from sklearn.ensemble import RandomForestRegressorrf = RandomForestRegressor(random_state=0)rf.fit(x_tr, y_tr)pred = rf.predict(test)submit = pd.DataFrame({'pred':pred})submit.to_csv('result.csv', index=False)ans = pd.read_csv('result.csv')print(ans) 저장
-
미해결
시험환경test 제2유형
강사님 안녕하세요. 강사님께서 말씀해주신 랜포 + train, test = train.align(test, join='left', axis=1) 하고나서 에러메시지가 뜨길래 추가적인 fillna(0)를 해주고, 아래와 같이 작성했는데요 문제에서 제시한 예시와 제 답안의 수치가 너무 차이가 많이납니다. 어떤부분이 문제일까요? ㅜ_ㅠ 확인 부탁드립니다. isnull 에 무조건 0채우라고해서 fillna(0)한거밖에 차이가 없습니다. import pandas as pdtrain = pd.read_csv("data/customer_train.csv")test = pd.read_csv("data/customer_test.csv")# print(train.info())# print(test.info())train = train.fillna(0)test = test.fillna(0)# df.isnull().sum()target = train.pop('총구매액')train = pd.get_dummies(train)test = pd.get_dummies(test)train, test = train.align(test, join='left', axis=1)train = train.fillna(0)test = test.fillna(0)from sklearn.model_selection import train_test_splitx_tr, x_val, y_tr, y_val = train_test_split(train, target, test_size=0.2, random_state=0)from sklearn.ensemble import RandomForestRegressorrf = RandomForestRegressor(random_state=0)rf.fit(x_tr, y_tr)pred = rf.predict(test)submit = pd.DataFrame({'pred':pred})submit.to_csv('result.csv', index=False)ans = pd.read_csv('result.csv')print(ans)
-
미해결자바 개발자를 위한 코틀린 입문(Java to Kotlin Starter Guide)
범위 비교 질문
안녕하세요.범위를 비교하는 방식의 성능차이에 대해서 궁금한데요.1번1<=x && 3>=x2번x in 1..31번방식에 비해 2번방식은 수열을 순회하면서 수열에 포함 여부를 확인하게 되는 방식일거 같은데, 제 예상이 맞을까요? 그렇다면 성능상 더 좋지 않을거 같아서요.감사합니다.