묻고 답해요
158만명의 커뮤니티!! 함께 토론해봐요.
인프런 TOP Writers
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
등분산이 같은지 다른지를 만약 모른다면,
문제에서 만약 안주어진다면, 레빈 검정을 우선 진행해서 pvalue값을 확인 해야하는거겠쬬?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
데이터 찾기
테스트 데이터와 train 데이터 프레임 안의 데이터가 서로 포함하지 못한다면, concat을 사용하여 합쳐서 label이나 one hot 인코딩 진행하라고 하셨는데요, 지금은 내부 데이터 양이 작아서 각 데이터 별로 서로 포함여부를 알 수 있는데 몇천 row가 되는 data들은 서로 포함되는지 어떻게 알 수 있을까요?
-
미해결[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
RMSE 질문
안녕하세요 강사님~RMSE 출력 할 때,from sklearn.metrics import mean_squared_error많이 사용하지만, 이번에 확인 해보니까 from sklearn.metrics import root_mean_squared_error가 있어서 사용 가능 할까요? 시험 체험에서도 dir()를 확인 한 결과 metrics 에 root_mean_squared_error 가 있는 걸 확인 했습니다. 감사합니다~
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
범주형 변수차이 발생시 concat 처리
범주형 변수 차이: train과 test 데이터에 포함된 범주형 변수의 카테고리 수가 다를 수 있습니다. 예를 들어, train에 있는 범주가 test에 없거나 그 반대의 경우입니다.=> train(A), test(B)라 예를 들면set으로 A-B했을 경우 변수가 나올때는 강의영상중 concat없이 인코딩 진행하셨고 B-A 변수 나올때 문제될수 있다고 이해했습니다만,A-B이든 B-A이든 변수차이 있으면 무조건 concat한후 인코딩하고 다시 분리하는게 맞는지요? 어느 강의는 그냥 인코딩하시고, 답변을 검색해보면 A-B변수가 나와도 concat하라는 답변이 나와서 명확한 기준을 모르겠습니다. A-B에 변수차이가 나오는 경우는(train에는 있고 test는 없는 변수 있는 경우) 그냥 인코딩해도 무관한것인가요?생략해도 되는 경우이면 단순하게 가는게 실수도 줄일수 있을듯 하여 문의드립니다.
-
해결됨디지털포렌식 입문자를 위한 디지털포렌식 전문가 2급 실기 시험대비 강의(Encase/Autopsy)
23회 실기시험
안녕하세요. 이번에 23회차 실기시험을 본 수험생인데요.이번에 결국 우려했던 GPT를 복구하는 문제가 나왔었습니다.다행이 강의를 보긴 봤어서 FAT32 파티션을 복구하는건 성공했는데, 다른 NTFS 파티션은 복구하지 못했습니다. ㅠㅠ아무리 확인봐도 LBA Starting Address도 이상했고 백업본 위치를 봐도 안나오던데 복구에 성공하신분 있으신가요 ㅠㅠ 있다면 어떻게 하신지도 좀 늦게나마 힌트를 얻고 싶습니다... (2급 시험이라 쉬울꺼라 생각했지만 의외로 시대흐름에 맞는 시나리오 내용도 나오고 여러모로 난이도가 어려웠습니다...)
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
작업형 2
학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요먼저 유사한 질문이 있었는지 검색해보세요작업형 2번에서 이진분류와 다중분류를 구별할 수 있는 방법이 궁금합니다. 어떤 데이터를 보고 판단할수있나요?
-
미해결
맥북m1 인텔리제이 환경변수 질문있습니다 !
vcs를 통해 팀원이 진행중이던 프로젝트를 vcs를 통해 받아왔습니다. 제가 수정해야할 부분은 edit configurations 에서 환경변수에 비밀번호를 설정하는것인데,, 대소문자구분도 잘해서 적은것 같은데 실행시 계속 오류가 뜹니다. db도 연동해둔 상태입니다 이외의 부분들은 건들지 말라고 팀원이 말을 해서,, 여기에 여쭤봅니다 ! 맥북m1사용중입니다 .
-
미해결[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
3과목 답안 제출 시 궁금한점이 있어요
안녕하세요, 강의 너무 잘 완독했습니다, 이번주가 드디어 시험이라, 여기서 잘 배운것들로 꼭 합격하고 오겠습니다.질문은, 제가 첫시험이다 보니 3과목 답안제출이 궁금합니다.3과목의 경우 1과목처럼 단순 답만 제출하는 걸까요 아니면 logit 이나 ols를 통해 나혼 print(model.summary()) 값과, 답을 함께 제출하는것일까요?예를 들면, 8회기출유형 (작업형3) 2-1번 문제의 경우 답은 코드 전체 +print(model.summary())를 내는것인지, 마지막 2.343 값만 print로 제출하면 되는건지 궁금합니다
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
이말은 왜 뜰까요?
XGBoost의 'manylinux2014' 변형을 설치했습니다. GPU 알고리즘이나 연합 학습과 같은 특정 기능은 사용할 수 없습니다. 이러한 기능을 사용하려면 glibc 2.28+의 최신 Linux 디스트로로 업그레이드하고 'manylinux_2_28' 변형을 설치하세요.
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
예측 정확도 정답 커트라인이 어느정도인가요?
영상과 같이 랜덤포레스트+라벨인코딩 조합으로 예측정확도 0.6나왔습니다. 해당 예측 정확도가 시험에 통과할 정도의 커트라인인지 궁급합니다. 또한 예측정확도가 잘 나오지 않을 경우 랜덤포레스트 이외 xgboost와같은 모델 변경도 시험장에서 크게 고려해야될 사항일까요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
작업형3
pred = model.get_prediction(new_data)로 할 때도 있고 pred = model.predict(new_data) 이렇게 할 때도 있나요? 둘의 차이가 뭘까요
-
해결됨직장인에게 꼭 필요한 파이썬-아래아한글 자동화 레시피
페이지를 넘어가는 문제 깔끔하게 정리하기
안녕하세요 일코님날씨 많이 추워졌는데 건강 잘 챙기시기 바랍니다 ^^현재 문제가 텍스트로만 이루어졌을 경우 아래와 같이 BreakPage메소드를 통해 페이지에 걸친 문제가 없도록 정리하고 있씁니다.while 찾기("#"): # 샵 "#"표시는 문제의 시작지점입니다. hwp.Run("MoveLineBegin") start_page = hwp.KeyIndicator()[3] start_pos = hwp.GetPos() # hwp.Run("MoveParaEnd") 둘중_빠른것_찾기("#", "<<<") 현재문단블록처리() if 블록내_텍스트_포함_여부("<<<"): hwp.Run("MovePageBegin") hwp.Run("MoveLeft") else: hwp.Run("MoveParaBegin") 위로_찾기_아무거나() # 다음문제로 넘어간뒤, 아무런 텍스트나 위로 찾기 하여 문제의 끝을 특정함 hwp.Run("MoveParaEnd") end_page = hwp.KeyIndicator()[3] endpos = hwp.GetPos() if end_page != start_page: # 문제 시작점과 끝점의 페이지가 다를 경우 BreakPage hwp.SetPos(*start_pos) hwp.Run("BreakPage") hwp.Run("MoveParaEnd") 문제는, 문제의 형식이 표로 되어 있을 때가 있다는 것인데요. 이런식으로 표가 존재하고, 이 표가 넘어갈경우에,, 현재 코드를 적용하면 저 "수정"으로 이동하여 endpos의 위치가 잡히게 되네요..문제가 표로 마무리 될경우에 문제의 끝을 올바르게 특정해서 문제를 깔끔하게 정리할 방법이 없을까요? 감사합니다 !
-
해결됨딥러닝 이론 + PyTorch 실무 완전 정복
Layer Norm이 언어모델에 적합한 이유
안녕하세요 선생님강의 정말 잘 보고 있습니다.Layer Normalization을 보는 중에 입력 데이터를 Normalization하는 것을 통해 scale이나 shift에 robust하게 되는 것까진 이해했습니다.이런 효과가 왜 이미지보다 언어 모델에 더욱 효과적인지 이유를 알 수 있을까요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
데이터 나누기 질문
from sklearn.model_selection import train_test_splitX_tr, X_val, y_tr, y_val = train_test_split(train.drop('TotalCharges', axis=1),train['TotalCharges'], test_size=0.2, random_state = 2024) X_tr데이터가 train일때랑 train.drop('TotalCharges', axis=1)일때랑 차이가 뭔가요 ??
-
미해결비전공자도 쉽게 구성하는 MSA 서비스 모니터링 대시보드
/send 404 에러
안녕하세요, gin 서버를 실행하고 curl -X GET localhost:8080/send명령어를 실행하면 404 page not found 에러가 나옵니다.어떤 부분이 문제인지 모르겠어 깃허브 주소 남깁니다.확인해주시면 감사하겠습니다. https://github.com/bonzonkim/trace-in-go 감사합니다.
-
미해결백엔드 개발자 성능 개선 초석 다지기
현업에서의 부하테스트 및 Ngrinder 설치
현업에서의 부하테스트와 Ngrinder 사용에 대해 질문드립니다. 현업에서는 부하테스트용 서버(e.g. Stage 서버)를 두고 해당 서버에 부하테스트를 하는지, 아니면 로컬에 띄워두고 간략하게 테스트를 하는지 궁금합니다.Ngrinder를 어떤 서버에 설치하는지 궁금합니다.별도의 IDC 서버에 설치한 후, 팀 내 개발자가 모두 해당 Ngrinder를 사용해 부하테스트를 적용하는지, 아니면 Ngrinder는 로컬 컴퓨터(개인 노트북 등)에 설치 후 부하 테스트 대상 서버만 Stage 환경 등에 두고 해당 서버에 테스트를 하는지 궁금합니다.
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
마인드맵 오타가 있네요:) 수정부탁드립니다,
spicy -> scipycfQ 혹시 마인드맵은 어떤 것으로 만들었는지 여쭤봐도 될까요?
-
미해결[C++과 언리얼로 만드는 MMORPG 게임 개발 시리즈] Part4: 게임 서버
운영체제에 구애받지 않는 네크워크 모델
너무나 알찬 수업 잘 듣고있습니다.수업들 듣던 중, 의문이 하나 생겨서 질문남깁니다. 네트워크 라이브러리중, boost::asio 를 이용해서 운영체제에 독립적인 환경을 구축할 수 있을거 같은데,네트워크 부분은 윈도우 맞춤으로 수업하시는 이유가 궁금합니다. boost::asio 의 기능만으로는, 효율적인 게임서버를 구축하기 어려워서 인가요?
-
미해결스프링 핵심 원리 - 기본편
SOLID 원칙
SOLID 5가지 원칙 중에 OCP 개방-폐쇄 원칙을 설명하는 도중 7:25 쯤에 private MemberRepository memberRepository = new MemoryMemberRepository(); 에서 JdbcMemberRepository() 객체 구현으로 변경할 시 private MemberRepository memberRepository = new JdbcMemberRepository(); 라고 나오는데 OCP의 원칙이 구현 객체를 변경하려면 클라이언트 코드를 변경해야 한다고 설명되어있습니다. 그런데 방금 변경된 코드에서 보면 private MemberRepository memberRepository 이 코드는 동일하게 되어있다는 것입니다. 도대체 무엇때문에 김영한 강사님께서 코드 변경 안하고 좀 안되지 않냐고 말씀하신지 알려주세요.
-
미해결[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
기출 8회 2유형 질문
원핫 인코딩시, train 과 test의 컬럼의수가 달라지는 경우가 있어서 데이터를 concat 했다가 다시 분리를 해주고 있는데요. 아래와 같이 코딩시 답안 제출까지는 가능하지만, 강사님께서 풀이한 것과 값차이가 많이 납니다. 이렇게 하면 안되나요?import pandas as pd train = pd.read_csv('churn_train.csv') test = pd.read_csv('churn_test.csv') y=train.pop('TotalCharges') print (train.shape, test.shape, y.shape) total = pd.concat([train, test], axis=0) total=total.drop('customerID',axis=1) # print (total.shape) cols=total.select_dtypes(include = 'object').columns total = pd.get_dummies (total[cols]) train = total[:4116] test = total[4116:] print (train.shape, test.shape, y.shape) from sklearn.model_selection import train_test_split X_train, X_val, y_train, y_val = train_test_split(train, y, test_size=0.2, random_state=0) print(X_train.shape, X_val.shape, y_train.shape, y_val.shape) from sklearn.ensemble import RandomForestRegressor rf = RandomForestRegressor() rf.fit(X_train, y_train) pred=rf.predict(X_val) pred from sklearn.metrics import mean_absolute_error mae = mean_absolute_error (y_val, pred) print(mae) # 결과값 제출 result = rf.predict(test) # print(result.shape, test.shape) print(result) result = pd.DataFrame ({ 'total price':result }) result.to_csv("result.csv", index=False) print(result) # help(sklearn) # import sklearn # help(sklearn.metrics )