묻고 답해요
158만명의 커뮤니티!! 함께 토론해봐요.
인프런 TOP Writers
-
해결됨실전도커: 도커로 나만의 딥러닝 클라우드 컴퓨터 만들기
섹션 7-3, dev container 관련 질문
선생님 안녕하세요좋은 강의 감사합니다. 섹션 7의 세번째 강의, python의 위한 도커 의 13:25 에서바로 torch를 pip으로 설치하지 않고도 바로 import torch를 할 수 있는 이유는azure vm을 만들때 선택한 size인 nc4as_t4_v3 4 vcpus 에 기본적으로 torch가 깔려있기 때문인가요 (즉, 만약 gpu를 사용하지 않는 다른 환경을 고르면, torch가 안깔려 있어서 pip 으로 깔아야 하는 것인가요) cpu만 사용하는 size인 Standard D2s v3 (2 vcpus, 8 GiB memory) 로 가상환경을 만들었는데, 여기서는 ipynb 파일에 !pip install torch를 해도, import torch를 하면 torch가 없다고 나오는데, 혹시 이 이유를 아실까요..ㅠ
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
이 문제에서 수치형 데이터와 범주형 데이터를 분리하는 과정이 꼭 필요한가요?
강사님은 수치형 데이터와 범주형 데이터를 n_train, c_train, n_test, c_test로 분리하셨더라구요.근데 꼭 분리 안하고, col 명만 설정해서 그냥 피처엔지니어링 하면 안되는 걸까요?근데 저는 점수가 0.75 정도밖에 안나왔습니다 ㅎㅎㅎ강사님은 0.8 넘게.... 제가 쓴 코드입니다..# 수치형 스케일링from sklearn.preprocessing import RobustScalerscaler = RobustScaler()cols = ['Age', 'AnnualIncome','FamilyMembers', 'ChronicDiseases'] <- 제가 변환하고 싶은 int 형 변수들을 넣었어요. 타겟레이블이 int형인데 뺄줄 몰라서 그냥...train[cols] = scaler.fit_transform(train[cols])test[cols] = scaler.fit_transform(test[cols]) # 라벨인코딩from sklearn.preprocessing import LabelEncodercols2 = train.select_dtypes(include="object").columns for col in cols2 : le = LabelEncoder() train[col] = le.fit_transform(train[col]) test[col] = le.transform(test[col])이러고 데이터 X_tr, X_val, y_tr, y_val로 분리하고 랜덤포레스트를 적용헀습니다!
-
미해결프로그래밍 시작하기 : 파이썬 입문 (Inflearn Original)
오늘부터 강의를 받게 되었습니다!
기획자이지만 파이썬이 중요하다고 하여,관련 베이스적인 지식을 쌓고자 강의 자료를 요청드립니다!!woooha94@gmail.com
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
작업형2 회귀, 작업형3 회귀
학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요먼저 유사한 질문이 있었는지 검색해보세요작업형2에서 모델링 및 평가에서 회귀모델 여러가지를 대입해보던 것과작업형3 회귀분석에서 formula 패키지 사용해서 회귀식 사용하는것은 어떤 차이가 있을까요?? 회귀분석이라고 해서 혼자 타이핑을 andomforestregressor 해보다가 지우고 formula를 따라 썼는데 너무 초보적인 질문일것같지만 궁금해서 문의드립니다.
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
메모장 이용 불가로 변경되었습니다.
안녕하세요 강의 잘 듣고 있습니다.지난 시험부터 메모장 이용 불가로 변경되었는데 강의 내용에 업데이트 반영이 되어 있지 않아서 공유드립니다. o 시험 중 필기구, 전자·통신기기(계산기 등) 및 PC에 설치되어 있는 프로그램(윈도우 메모장, 윈도우 계산기, 엑셀 등) 사용 불가 https://www.dataq.or.kr/www/board/view.do?bbsKey=eyJiYnNhdHRyU2VxIjoxLCJiYnNTZXEiOjU1MzQ3NX0=&boardKind=notice 감사합니다.
-
미해결
스프링 시큐리티 콘피그관련
userRepository에서Optional<SiteUser> findByUsername(String username);Optional를 사용했어요CustomUserDetailsService 파일에서 @Overridepublic UserDetails loadUserByUsername(String username) throws UsernameNotFoundException {SiteUser user = ur.findByUsername(username); < 이런식으로 못 불러오더라구요... if(user != null) {return new CustomUserDetails(user);}return null; Optional<SiteUser> findByUsername(String username);Optional로 사용하는 이유와 사용안해도 상관없는지 유무를 알고 싶어요 헬프미}
-
해결됨김영한의 실전 자바 - 기본편
자바 메모리 관련 질문
메서드 영역은클래스 정보static 영역런타임 상수 풀이렇게 세가지로 구성되어 있는걸로 알고 있습니다.static 메서드와 그냥 메서드 둘다 클래스 정보에 저장되는게 맞지만, 둘의 차이는 참조값(인스턴스) 없이 호출 가능하느냐, 아니냐의 차이가 맞을까요?만약 아니고 static 메서드는 static 영역에 저장된다고 한다면, static 영역에 있기 때문에 static 메서드는 참조값 없이 호출 가능한것 인가요?
-
미해결김영한의 실전 자바 - 중급 1편
자바 메모리 관련 질문입니다.
학습하는 분들께 도움이 되고, 더 좋은 답변을 드릴 수 있도록 질문전에 다음을 꼭 확인해주세요.1. 강의 내용과 관련된 질문을 남겨주세요.2. 인프런의 질문 게시판과 자주 하는 질문(링크)을 먼저 확인해주세요.(자주 하는 질문 링크: https://bit.ly/3fX6ygx)3. 질문 잘하기 메뉴얼(링크)을 먼저 읽어주세요.(질문 잘하기 메뉴얼 링크: https://bit.ly/2UfeqCG)질문 시에는 위 내용은 삭제하고 다음 내용을 남겨주세요.=========================================[질문 템플릿]1. 강의 내용과 관련된 질문인가요? (예)2. 인프런의 질문 게시판과 자주 하는 질문에 없는 내용인가요? (예)3. 질문 잘하기 메뉴얼을 읽어보셨나요? (예)[질문 내용]메서드 영역은클래스 정보static 영역런타임 상수 풀이렇게 세가지로 구성되어 있는걸로 알고 있습니다. static 중첩 클래스, static이 없는 내부 클래스는 메모리 구조상 어디에 저장 되나요?
-
미해결실전! 스프링 데이터 JPA
count query에 대한 질문
학습하는 분들께 도움이 되고, 더 좋은 답변을 드릴 수 있도록 질문전에 다음을 꼭 확인해주세요.1. 강의 내용과 관련된 질문을 남겨주세요.2. 인프런의 질문 게시판과 자주 하는 질문(링크)을 먼저 확인해주세요.(자주 하는 질문 링크: https://bit.ly/3fX6ygx)3. 질문 잘하기 메뉴얼(링크)을 먼저 읽어주세요.(질문 잘하기 메뉴얼 링크: https://bit.ly/2UfeqCG)질문 시에는 위 내용은 삭제하고 다음 내용을 남겨주세요.=========================================[질문 템플릿]1. 강의 내용과 관련된 질문인가요? (예/아니오)2. 인프런의 질문 게시판과 자주 하는 질문에 없는 내용인가요? (예/아니오)3. 질문 잘하기 메뉴얼을 읽어보셨나요? (예/아니오)[질문 내용]안녕하세요 Spring 강의 열심히 듣고 있습니다.paging 관련해서 듣다가 문득 궁금한 것이 생겨서 질문드립니다.현재까지 배운 Spring data jpa에서는 매번 paging을 요청할 때마다 count 쿼리도 같이 날라가는데요, JPA를 떠나 일반적인 실무 환경에서도 매번 paging 쿼리와 count 쿼리를 같이 날리는지가 궁금합니다.paging 쿼리를 매번 날리면 새로운 게시물이 등록된 경우에 해당 게시물도 paging에 넣어서 계산할 수 있다는 장점은 있는 것 같은데 paging가 바뀔 때마다 count 연산이 수행된다는 것이 큰 오버헤드가 발생할 수도 있다는 생각이 들기도합니다..관련해서 어떻게 구현하는 것이 best pratice에 가까울까요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
이 문제에서 df=pd.concat 으로 X_train과 y_train의 타겟을 합치는 이유가 무엇인가요?
train이 두개로 나누어져서 제공되서x_train+y_train['타겟'] 을 합치는거까지는 이해했는데요이걸 df에 받아서 넣는데 그 다음 코드부터는 df를 사용하지를 않더라고요!그래서 모든 코드 다 작성 후에, df=concat 어쩌구 했던거를 주석처리해서 숨겨봤는데도 같은 결과가 나왔어요. 합쳐진 df를 어딘가에 사용한다면 이해가 되는데,df를 사용하지도 않는데 concat으로 합쳐놓는 이유가 무엇인가요? 참고 차 제가 작성했던 코드도 붙여넣어봅니다. import pandas as pdX_train = pd.read_csv("X_train.csv")X_test = pd.read_csv("X_test.csv")y_train = pd.read_csv("y_train.csv")# print(X_train.shape, X_test.shape, y_train.shape)df = pd.concat([X_train, y_train['Reached.on.Time_Y.N']], axis=1)df# 라벨인코딩from sklearn.preprocessing import LabelEncodercols = X_train.select_dtypes(include="object").columnsfor col in cols : le = LabelEncoder() X_train[col] = le.fit_transform(X_train[col]) X_test[col] = le.transform(X_test[col])# # 랜덤 포레스트 위해서 데이터 분리X_train = X_train.drop("ID", axis=1)X_test_id = X_test.pop("ID")# # 데이터 분리from sklearn.model_selection import train_test_splitX_tr, X_val, y_tr, y_val = train_test_split( X_train, y_train['Reached.on.Time_Y.N'], test_size=0.2, random_state=2022)# 랜덤포레스트from sklearn.ensemble import RandomForestClassifierrf = RandomForestClassifier(random_state=2022, max_depth=3, n_estimators=200)rf.fit(X_tr, y_tr)pred = rf.predict_proba(X_val)from sklearn.metrics import roc_auc_scoreprint(roc_auc_score(y_val, pred[:,1]))pred = rf.predict_proba(X_test)submit = pd.DataFrame({ "ID" : X_test_id, "Reached.on.Time_Y.N" : pred[:,1]})submit.to_csv("submit.csv", index=False)pd.read_csv("submit.csv")
-
미해결빅데이터분석기사 실기대비 (R 활용)
출제예상 문제 질문이요~
안녕하세요 오늘부터 빅분기 실기 R강의수강을 시작한 학생입니다. 강의를 듣던 중 궁금한 점이 있어서요 출제예상 문제중에서아래 표시를 해두었는데요 데이터를 불러올때 왜 1부터 150행까지만 불러오는 것일까요? airquality 데이터 전체를 df으로 불러오는건 안되는건가요? # 2. 첫 행부터 상위 80%개의 행을 추출하고 Ozone변수의 결측값을 Ozone변수의 중앙값으로 대체하고# 대체전과 후의 표준편차 값의 차이df <- airquality[c(1:150),] ------------------------------> 이부분이 궁금해요!str(df)val <- nrow(df)*0.8df1 <- df[c(1:val),]str(df1)df1$Ozone_comp <- ifelse(is.na(df1$Ozone), median(df1$Ozone, na.rm = T), df1$Ozone)summary(df1)sd(df1$Ozone, na.rm = T) - sd(df1$Ozone_comp, na.rm = T)result <- sd(df1$Ozone, na.rm = T) - sd(df1$Ozone_comp, na.rm = T)print(result)
-
미해결스프링 입문 - 코드로 배우는 스프링 부트, 웹 MVC, DB 접근 기술
오류 발생
뭐가 문제일까요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
작업형 2유형 모델 학습 관련
안녕하세요, 좋은 강의 감사드립니다!학습, 검증데이터를 분리하는 것은 평가를 통해 개선하기 위한 것으로 이해를 했습니다.그렇다면 개선을 한 뒤 학습, 검증데이터를 다시 학습데이터로 합친 후 예측을 진행하는 것이 점수에 더 도움이 될까요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
윌콕슨 검정 반대로했을때 값이 달라지는현상
아무리봐도 둘이 값이 같게나와야할거같은데 p-value가 다르게나옵니다. 왜이런걸까요??비모수검정이라 정규분포가 아니라서 대칭성이 없어서 그런건가요?
-
해결됨애플리케이션 배포 자동화와 CI/CD
강사님 gift code 만료됐습니다.
부록강의에서 gift code 만료됐다고 전달 드릴려고 글 씁니다. 그리고 부록 강의에서 Rocky Linux 8 로 만든 인스턴스로는 docker 설치가 안됩니다. 그리고 참고로 볼륨이 좀 많이 낮네요. 다음 강의에는 볼륨 좀 키워주십시오. 감사합니다.
-
미해결코로나맵 개발자가 알려주는 React + Express로 지도서비스 만들기 (Typescript)
MongoDB Compass 관련 질문
MongoDB compass에서 new connection에서 말씀하신 대로 mern, merntest, admin 이렇게 설정해주고, connect 버튼을 눌렀는데 Authentication failed라는 오류가 뜹니다. 어느 부분에서 오류가 난 건가요..?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
캐글 T1-12에서 접종률 100% 이상 데이터 먼저 삭제하지 않는 이유
아래 문제에서 100% 넘는 접종률을 먼저 삭제하지 않고, 문제에서 언급한 순서대로 풀이해야 하나요??your code 부분에 적은대로 풀이를 하면 답이 다른데 이대로 풀면 안되는 이유가 궁금합니다! 문제 : 주어진 데이터에서 상위 10개 국가의 접종률 평균과 하위 10개 국가의 접종률 평균을 구하고, 그 차이를 구해보세요(단, 100%가 넘는 접종률 제거, 소수 첫째자리까지 출력)# your code # 100%가 넘는 접종률 제거 cond = df["ratio"] <= 100 # 상위 10개 국가의 접종률 평균과 하위 10개 국가의 접종률 평균을 구하고, df = df[cond] df = df.sort_values("ratio", ascending = False) top10 = df["ratio"].head(10).mean() bottom10 = df["ratio"].tail(10).mean() # 그 차이를 구해보세요(소수 첫째자리까지 출력) print(round(top10 - bottom10,1)) 풀이df2 = df.groupby('country').max() #시간에 따라 접종률이 점점 올라감 df2 = df2.sort_values(by='ratio', ascending = False) #100%가 넘는 접종률 제거 cond = df2['ratio'] <= 100 df2 = df2[cond] top = df2['ratio'].head(10).mean() bottom = df2['ratio'].tail(10).mean() print(round(top - bottom,1))
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
카이제곱 통계량은 어떻게 구하면 되나요?
빅분기 실습환경이 오픈되어 제3유형 문제를 풀어보고 있는데요. 데이터는 타이타닉 침몰 생존여부 예측을 위한 자료입니다. Gender와 Survived 변수 간의 독립성 검증을 실시하였을 때, 카이제곱 통계량은? - 오브젝트 타입을 원핫인코딩으로 변환한 후 stats.chisquare(df[ 'Gender'], df['Survived'])를 수행해야 하나요? ols를 통해 summary() 까지는 알겠는데.....그 이후 어떻게 해야 할지 잘 모르겠네요..ㅠㅠ
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
randomforestclassifire()에서 random_state안 적어도 되나요?
학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요먼저 유사한 질문이 있었는지 검색해보세요 randomforestclassifire()에서 random_state안 적어도 되나요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
cols로 안 묶고 하면 실행이 안되는 건가요?
학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요먼저 유사한 질문이 있었는지 검색해보세요cols로 안 묶고, 배웠던 데로 데이터 분리에서 train.drop('성별, axis=1) 이렇게 했는데 오류가 뜹니다.