묻고 답해요
158만명의 커뮤니티!! 함께 토론해봐요.
인프런 TOP Writers
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
7회 2형 문의드립니다 (cross_val_score)
cross_val_score를 활용해서 rmse 평가를 시도해보았습니다.SCORERS에서 가장 유사하다고 판단되는 'neg_root_mean_squared_error'를 활용하였고, 음수로 나타난 값들을 얻었습니다.cross_val_score 함수는 값이 클 수록 좋은 모델임을 의미하므로, 보다 더 큰 값(더 작은 음수값)을 뱉는 모델을 찾아야 하는 것인지,혹은, RMSE 정의에 따라 에러값이 더 작은 값(더 큰 음수값)을 뱉는 모델을 찾아야 하는 것인지 문의를 드립니다. 예를 들어, cross_val 평균 측정값이#rf1 -399521.89795809553#rf6 -377713.996299675일 때, rf1과 rf6 중 어느 모델을 선택하는 것이 맞는지 궁금합니다.
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
스케일링시 데이터 분리 없이 하는 방법
dcols = train.select_dtypes(include='O').columnsncols = train.select_dtypes(exclude='O').columns위처럼 데이터를 인코딩과 스케일링 작업하기 전에 수치형, 오브젝트의 컬럼명을 변수에 미리 저장해 놓고, 아래처럼 분리 없이 스케일링과 인코딩 작업을 진행해도 되는지 궁금합니다. 동작은 제대로 하는 것 같아서 굳이 분리해야 하나 의문이 들어 질문 드립니다. 라벨인코딩과 스탠다드 스케일러를 둘 다사용한다고 가정했을 때 입니다. from sklearn.preprocessing import StandardScalerscale = StandardScaler()train[ncols] = scale.fit_transform(train[ncols])test[ncols] = scale.fit_transform(test[ncols]) from sklearn.preprocessing import LabelEncoderle = LabelEncoder() for col in dcols:train[col] = le.fit_transform(train[col])test[col] = le.fit_transform(test[col])
-
해결됨(2025) 일주일만에 합격하는 정보처리기사 실기
예제 2번 풀이
예제 2번 &&다음 !가 있는 거면 아닌거 찾는 거 아닌가요? 해설 다시 부탁드립니다.
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
LabelEncoder 관련해서 질문드립니다.
범주형 데이터를 Feature engineering 할때 train과 test가 같은 피처의 범주가 다를 경우 합친 후 get_dummies를 통해 한번에 진행해주셧는데요. 만약에 LabelEncode로 진행할 경우 Train에서는 fit_transform 을 하고 test에서 transform 만하는데 all_df로 합친후 어떻게 하면 되나요?
-
미해결10주완성 C++ 코딩테스트 | 알고리즘 코딩테스트
139p 우선순위큐 커스텀 정렬
- 학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요! - 먼저 유사한 질문이 있었는지 검색해보세요. - 서로 예의를 지키며 존중하는 문화를 만들어가요. - 잠깐! 인프런 서비스 운영 관련 문의는 1:1 문의하기를 이용해주세요. 안녕하세요139p 우선순위큐 커스텀 정렬을 넣을 때 반대로 넣어야 하는 특징이있다고 적혀있습니다. 뭔가 큐의 성질과 관련이 있을 것 같은데 자세한 원리를 알고 싶습니다. 반대로, 우선순위 큐가 아닐 때에는 어떤 원리인지도 궁금합니다. 감사합니다
-
해결됨스프링 MVC 1편 - 백엔드 웹 개발 핵심 기술
Content-Type 질문
1번 text/html2번 application/x-www-form-urlencoded 질문:a. 둘 다 Content-Type이 html인 걸로 알고있는데 2번은 html form에 사용되는 거고, 1번도 html form에 사용되는 거 아닌가요?!b. 1번과 2번의 차이가 뭔가요?c. 1번과 2번의 post전송 방식이 어떻게 다른 건가요?
-
미해결스프링 DB 1편 - 데이터 접근 핵심 원리
test.mv.db 파일이 생성된걸 어디에서 확인 가능한가요?
학습하는 분들께 도움이 되고, 더 좋은 답변을 드릴 수 있도록 질문전에 다음을 꼭 확인해주세요.1. 강의 내용과 관련된 질문을 남겨주세요.2. 인프런의 질문 게시판과 자주 하는 질문(링크)을 먼저 확인해주세요.(자주 하는 질문 링크: https://bit.ly/3fX6ygx)3. 질문 잘하기 메뉴얼(링크)을 먼저 읽어주세요.(질문 잘하기 메뉴얼 링크: https://bit.ly/2UfeqCG)질문 시에는 위 내용은 삭제하고 다음 내용을 남겨주세요.=========================================[질문 템플릿]1. 강의 내용과 관련된 질문인가요? (예/아니오)2. 인프런의 질문 게시판과 자주 하는 질문에 없는 내용인가요? (예/아니오)3. 질문 잘하기 메뉴얼을 읽어보셨나요? (예/아니오)[질문 내용]여기에 질문 내용을 남겨주세요.test.mv.db 파일이 생성된걸 어디에서 확인 가능한가요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
작업형1 모의문제3 9번문제
df = df['month'].value_counts()이런식으로 values_counts로 구하는 방법이 있을까요?또 빅분기 실기 시험 채점(?) 방식에 대해서도 궁금한게,저런식으로 value_counts()를 하면 정답이 바로 눈에 보이잖아요! 그럼 그 정답을 바로 print(11)로 해도 인정이 되는지 궁금합니다
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
df 데이터에서 iloc를 이용해 train, test 데이터로 나누는 방법
학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요먼저 유사한 질문이 있었는지 검색해보세요5분 14초에서 train=df.iloc[:210]에서 뒤에 .copy() 안붙여도 되나요?train=df.iloc[:210]test=df.iloc[210:]
-
미해결
수강 기간 연장 요청
“AWS Certified Solutions Architect - Associate 자격증 준비하기 강의 수강 기간 연장을 하고 싶은데, 이미 수강 기간이 끝나버려서, 직접적으로 강의에 접근해서 게시글 작성이 안되고 있는 상황입니다.수강기간 연장을 위해 어떻게 지식공유자에게 연락할 수 있나요?
-
미해결재고시스템으로 알아보는 동시성이슈 해결방법
LettuceLock 에러
안녕하세요.올려주신 강의를 보고 따라하다가 에러가 발생하여 질문드립니다.모든 테스트는 정상으로 떨어지나, LettuceLock 테스트만 에러가 발생을 하네요...제가 디버깅 했을 때는 public Boolean lock(Long key) { return redisTemplate .opsForValue() .setIfAbsent(generateKey(key), "lock", Duration.ofMillis(3_000)); }해당 부분이 키를 갖고 오지 못하는 거 같은데, 해결 방법이 있을까요??
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
다중회귀분석에서 유의수준이 0.05가 아니라면 어디서 값을 설정해줘야 하나요?
from statsmodels.formula.api import ols formula = "temperature~solar+wind+o3" model = ols(formula, data=df).fit() print(model.summary())위는 유의수준 기본값이 0.05인 거죠? 그렇다면 유의수준 0.01로 분석할때 어디서 설정을 해줘야 하나요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
lightgbm 을 사용해서 만들어봤는데요 중간에 이렇게 나와요
학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요먼저 유사한 질문이 있었는지 검색해보세요3회 2유형으로 lightGBM을 활용해 봤는데요... 에러가 나와요
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
ols 모델 해석
공부하다보니 statsmodels ols 해석 관련해서 헷갈리는 부분이 있습니다.statsmodel로 ols 모델 만들어두고 model.summary()로 해석하거나 anova_lm(model)로 해석할 수 있던데, 두개의 차이점이 뭔가요??
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
캐글 T1-23
캐글에 올려주신 자료 중 T1-23 문제를 풀고 있습니다.f1컬럼에서 10번째로 큰 값을 찾는 중에 질문이 생겨 질문 드립니다! 실제로 f1을 소팅해서 보면 중복값이 있어 10번째로 큰 값이 86인데 선생님 풀이에는 소팅해서 10번째에 있는 값인 88로 대체하셨더라고요실제 값에 관계없이 10번째에 위치한 값으로 대체해도 되는 건가요? 선생님 풀이)# f1데이터에서 10번째 큰 값으로 결측치를 채움top10 = df['f1'].sort_values(ascending=False).iloc[9]print(top10)df['f1'] = df['f1'].fillna(top10)결과) 88.0 실제 값 소팅 결과)print(df.sort_values('f1',ascending=False).head(15)) id age city f1 f2 f3 f4 f5 56 id57 3.0 대구 111.0 0 NaN ISFJ 29.269869 7 id08 38.0 서울 101.0 1 NaN INFJ 83.685380 57 id58 0.0 대구 100.0 2 NaN ESTP 33.308999 73 id74 45.0 경기 98.0 0 NaN ESTP 52.667078 71 id72 8.0 경기 97.0 0 NaN ESTJ 97.381034 69 id70 -9.0 경기 96.0 1 NaN ISTP 48.431184 77 id78 92.0 경기 96.0 1 NaN INTJ 69.730313 32 id33 47.0 부산 94.0 0 NaN ENFJ 17.252986 48 id49 75.0 대구 88.0 0 NaN INTP 37.113739 44 id45 97.0 대구 88.0 0 NaN ENFJ 13.049921 17 id18 41.0 서울 87.0 2 NaN ISFJ 80.138280 62 id63 88.0 경기 86.0 1 NaN ISFJ 73.586397 68 id69 75.0 경기 85.0 0 NaN ESTJ 69.730313 15 id16 68.0 서울 85.0 0 NaN ESFP 16.283854 4 id05 24.0 서울 85.0 2 NaN ISFJ 29.269869
-
미해결
혹시 이렇게하면 지장이 있을까요?
이 강의에서 h2-database 관련해서 계속 오류가 발생합니다. 일단 해결은 시도중이나.. 일단 다음 강의부터는 어떻게 흘러가는지 보기만 하고.. 김영한님 로드맵 따라 "스프링 핵심 원리 - 기본편" 여기서부터 다시 프로젝트를 만들어도 될까요?휴학생이라서 온라인 부트캠프도 하고 있습니다. 그곳에서 쿼리문을 이용해서 순수 jdbc를 만들어봐서 개념은 익히고 있어요.. 그래서 이 방법으로 해도 괜찮을지 여쭤보고 싶습니다. 강의에서도 김영한 강사님이 옛날방식으로 간단하게만 들어달라고 하셔서 여기서 목매는 것보다 일단 눈으로만 이 파트보고 넘어가는게 나을거 같아서요..
-
해결됨모의해킹 실무자가 알려주는, SQL Injection 공격 기법과 시큐어 코딩 : PART 1
Json으로 데이터를 주고 받을 때 인젝션
안녕하세요. 항상 양질의 강의를 제공해주셔서 정말 감사합니다! 대상 웹서버가 Json 형태로 데이터를 주고 받고 있는데요. 키 값에 SQLInjection 공격이 가능한가요? 저는 한번도 성공한 적이 없어서요. 된다면 URL 인코딩을 하지 않는 게 맞겠죠? 그리고 json형태로 데이터가 전달될 때 이게 api 사용인지 웹페이지 호출인지 어떻게 구분하는 게 좋을까요? 웹페이지도 확장자를 안 보이게 할 수 있으니까요 어떻게 구분하는 게 좋을지 궁금합니다 ^^ 감사합니다!
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
sum과 len 수업중 질문이 있어요
count가 결측치를 체크하지 않아서 2라고 하셨는데 무슨 말인가요?ㅠㅠ 3분20초 내용입니다.
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
인코딩
학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요먼저 유사한 질문이 있었는지 검색해보세요저는 레이블인코딩으로 밀고나갈건데요!train의 범주형 컬럼의 카테고리 ⊂ test의 범주형 칼럼의 카테고리 이거나 아예 두개가 다를 경우만train, test 합친 후에 레이블 하고나머지의 경우는 그냥 레이블인코딩 하는걸로 암기하면되나요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
작업형2 모의문제2 전처리
오브젝트 컬럼 전처리 시에예를들어 test에는 있는데 train에는 없다면 데이터를 합쳐서 라벨 또는 원핫 인코딩 가능하다면 데이터를 합친다는거는 train데이터와 test데이터를 합치는 거는 data_all = pd.concat(train,test) 이런식으로 합치고 인코딩 후 나누면 되나요?? 합친 후 인코딩 후 소스가 궁금합니다. 추가로 위와 같은경우에 바로 라벨인코딩하면 에러나나요? 만약 neigbourhood 컬럼 test 값에 train에 포함되지 않은 값이 있다면.