묻고 답해요
130만명의 커뮤니티!! 함께 토론해봐요.
인프런 TOP Writers
-
미해결[핵집] 2024 빅데이터 분석기사(필기)_과목 3~4
수업자료 통합본 공유 요청 건
안녕하세요, 강의 잘 수강하고 있습니다.필기 3~4 수업자료 통합본 발송 부탁 드립니다.jinseong.choi@hyosung.com 감사합니다.
-
미해결15일간의 빅데이터 파일럿 프로젝트
각 서버에 설치하는 프로그램은 어떻게 정하나요?
안녕하세요!강의 듣다 궁금한 점이 몇 가지 있어 질문 드립니다.먼저 강의에서는 빅디님께서 각 서버에 설치할 프로그램을 알려주셔서 편하게 설치는 했는데, 어떤 기준으로 설치할 프로그램을 선택하고 각 서버에 설치할 프로그램을 나눠서 아키텍처를 짜셨는지 빅디님의 관점?이 궁금합니다.예를 들어 postgreSQL는 서버 1에만 설치하고, HBase Region 같은 경우는 서버 세 곳 모두 설치 한 이유와, 다른 RDBMS 중에서도 postgreSQL을 선택한 특별한 이유 같은거요..!그리고 서비스 중간에 서버를 늘리려고 할 때 추가해야 하는 서버 수는 어떻게 정하나요? 모니터링 하다가 서버 전체 메모리의 몇 퍼센트를 차지하게 되면 서버를 늘려야 한다 이런 기준이 있을까요? 비용은 제외하고 기술적인 부분에서 기준으로 세울만한 건 어떤게 있는지 궁금합니다. 현업에서는 프로젝트 특성마다 다 다르게 설계를 해야 할 테고 3V 관점으로 봐야 한다는 건 알겠는데 조금 더 구체적인 예시가 있으면 이해하는데 도움이 많이 될 것 같습니다! 감사합니다:]
-
미해결[핵집] 2024 빅데이터 분석기사(필기)_과목 1~2
강의자료 통합본 요청합니다.
빅분기 1~2와 3~4 모두 강좌 신청했습니다. 강의 자료 통합본 요청드립니다.kwonej89@naver.com
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
RMSLE 관련 로그 함수관련 문의
학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요먼저 유사한 질문이 있었는지 검색해보세요안녕하세요? 제가 LOG 함수관련해서 조작법이 서툴러서요. RMSLE관련해서 공식을 찾아보니 아래오 같더라구요근데, 강의자료에 작성된 코딩을 보면 11sqrt(np.mean(np.power(np.log1p(y_test) - np.log1p(y_pred), 2))) 와 같습니다. 여기서 np. log1p(t_test) 이 코딩과 위에 공식이 같은건가요. +1이 여긴 반영되어 있는건지 모르겠습니다. 로그관련 설명을 좀 부탁드리겠습니다.
-
미해결쉽게 따라하는 빅데이터 논문 작성법 with ChatGPT (빅카인즈 기사 LDA&감성분석)
불용어 처리 관련 질문드립니다.
안녕하세요LDA 분석하는 강의에서 데이터의 특수문자나 외자 등 불용어들이 깔끔하게 정리가 안되서 불용어 제거하는 팁을 보여주셨었잖아요.df['title_contents']=df['title_contents'].str.replace(pat="는",repl="")이 과정을 데이터 전처리 단계에서 형태소 추출하는 단계에서도 적용할 수 있는 것 같아서 아래와 같이 해보았는데 에러 메세지가 떠서 .. 어떤 부분이 문제인지 좀 여쭤보고 싶습니다.도움 부탁드립니다. 감사합니다.
-
미해결[핵집] 2024 빅데이터 분석기사(필기)_과목 1~2
강의 통합 요약본 요청합니다
금일 1~2신청하여 강의 전입니다 해덩 1~2강의 통합본 받을수 있을까요?khandong109@nse.co.kr 입니다
-
미해결[핵집] 2024 빅데이터 분석기사(필기)_과목 1~2
수업자료 통합본 요청의건
안녕하세요 한동국입니다 금일 1~2신청하여 강의 전입니다 해덩 1~2, 3~4 강의 통합본 받을수 있을까요? khandong109@naver.com 입니다
-
미해결쉽게 따라하는 빅데이터 논문 작성법 with ChatGPT (빅카인즈 기사 LDA&감성분석)
워드 클라우드 cloud=wc.fit_words 코드 에러
안녕하세요아까 문의드렸던 tdm 부분은 잘 해결되었습니다. 빠른 답변 감사드립니다.하지만 어제 문의드렸었던 워드클라우드 이미지 만들때 쓰는 아래 코드가 여전히 에러입니다.cloud=wc.fit_words(count_dic)답변주신대로 폰트 적용되어 있는데 왜 자꾸 안되는지 모르겠습니다..도와주세요
-
미해결쉽게 따라하는 빅데이터 논문 작성법 with ChatGPT (빅카인즈 기사 LDA&감성분석)
형태소 분석 및 워드클라우드 질문드립니다.
안녕하세요 어제 워드클라우드 관련 다음 코드 cloud=wc.fit_words(count_dic) 오류 관련해서 질문드렸었습니다.답변 주신대로 폰트도 코랩 폴더에 업로드해서 업로드된 경로를 넣어줬습니다.오늘 다시 해보려고 하니까 아래 그림과 같이 이번에는 dtm 코드에서 또 에러가 나는데 이거 저는 도대체 왜 안되는 걸까요? ㅠㅠ도와주세요
-
미해결쉽게 따라하는 빅데이터 논문 작성법 with ChatGPT (빅카인즈 기사 LDA&감성분석)
3강 워드클라우드 만들기 관련 질문입니다.
안녕하세요 구글 코랩에서 화면대로 빅카인즈에서 데이터 추출해서 단어 빈도분석 및 워드클라우드 시각화 하는 방법 배우고 있습니다. 그런데 cloud=wc.fit_words(count_dic) 코드가 다음과 같이 에러가 뜨면서 실행이 되지 않습니다. 확인 부탁드립니다. 감사합니다!! --------------------------------------------------------------------------- OSError Traceback (most recent call last) <ipython-input-57-63f7188bfec7> in <cell line: 1>() ----> 1 cloud=wc.fit_words(count_dic) 5 frames/usr/local/lib/python3.10/dist-packages/PIL/ImageFont.py in getbbox(self, text, mode, direction, features, language, stroke_width, anchor) 419 :return: ``(left, top, right, bottom)`` bounding box 420 """ --> 421 size, offset = self.font.getsize( 422 text, mode, direction, features, language, anchor 423 ) OSError: invalid outline
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
결측값 채우지관련해서
안녕하십니까? 결측값 채우기 중 최빈값 관련해서,,m = X_train['workclass'].mode()[0] 여기서 mode()과 mode()[0]의 차이는 무엇인지요? 즉 [0]의 쓰임이 무엇인지? 다른 중앙값, 평균 등은 이런게 없는데 왜 최빈값만 이런게 뒤에 붙는지요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
7회 기출문제 풀이
인프런 문제를 열심히 풀고 있습니다.7회 기출문제 풀이는 언제 볼수있을까요?
-
미해결[핵집] 2024 빅데이터 분석기사(필기)_과목 1~2
통합강의자료 요청
안녕하세요 금일부터 강의를 수강하게 되어 아래와 같이 요청 및 문의 드립니다.통합 강의자료 요청 (이메일:moontomis@gmail.com)안내되어 있는 2024 빅데이터분석 기사 필기 한권완성 교재를 사면 어떤 도움이 되나요?이상입니다.감사합니다.
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
라이브러리 및 데이터 불러오기 그리고 EDA 수업내용중에
라이브러리 및 데이터 불러오기 그리고 EDA 수업내용중에15분 36초 경에 보면 남성과 여성의 수를 확인하는데, 그때 남성의 수를 cond_male이라는 변수에 담았기 때문에 len(cond_male) 이렇게만 하면 안되나요? 왜 train[cond_male]이렇게 해주어야 하는지가 궁금합니다. 보통 데이터 프레임 안에서 컬럼을 선택할때 데이터프레임명['컬럼명'] 이런식으로 할때나 사용하는데, 변수로 지정후에도 왜 train으로 감싸나요??
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
시계열데이터에서 dt관련
학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요먼저 유사한 질문이 있었는지 검색해보세요 안녕하세요? 시계열 자료 강의에서 년월일 등을 추출하는 강의가 있는데요.. 여기서 dt가 갑자기 나와서요.. 이것도 그냥 함수인가요.. 아님 뭐 datetime의 약자 뭐 그런건지요? dt관련해서 이거 뭐하는 함수인지 궁긍합니다.
-
미해결쉽게 따라하는 빅데이터 논문 작성법 with ChatGPT (빅카인즈 기사 LDA&감성분석)
3강 질문입니다.
안녕하세요.파이썬 초보인데 강의보면서 어려워도 따라해보고 있습니다.2강 까지 title_content 열에 제목+본문 내용의 형태소 추출 하는 것 까지 하고 나서 3강에서 추출된 내용을 df=head()로 확인했을때딱 title_content 부분만 나오던데 이거는 하는 방법이 따로 있나요? 저는 전체 열이 다 나오는데 엑셀에서 파일을 지우는 건지 아니면 따로 title_content 열만 나오게 하는 코딩을 해야 하는지 궁금합니다!
-
미해결[핵집] 2024 빅데이터 분석기사(필기)_과목 1~2
수업자료통합본 요청
필기 1~2 및 3~4 수업자료 통합본 발송 부탁 드립니다.kiwol@naver.com
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
기출 6회 작업형 1 질문
3. 연도별로 총 범죄 건수(범죄유형의 총합)의 월평균 값을 구한 후 그 값이 가장 큰 연도를 찾아, 해당 연도의 총 범죄 건수의 월평균 값을 출력하시오. (반올림하여 정수로 출력)문제에서 df['총범죄건수'] = df.iloc[:, 1:7].sum(axis=1)iloc 를 활용해서 열의 합을 구할 때는 sum 괄호 안에 axis=1 이라고 작성을 하는데 result = df.groupby('연도')['총범죄건수'].sum(axis=0)/12연도별로 그룹으로 묶어 행의 합을 구할 때는 sum 괄호 안에 axis=0 이라고 넣으면 오류가 나더라구요! iloc 를 활용해서 합을 구할 때는 sum 괄호 안에 axis 를 작성해도 되지만, groupby 를 활용해서 합을 구할 때는 sum 괄호 안에 axis 를 작성하면 안된다고 외워야 하는 건가요??
-
미해결15일간의 빅데이터 파일럿 프로젝트
파일럿 프로젝트 pc 환경 구성 질문입니다.
혹시 docker를 활용해서 실습환경을 구축하여도 문제가 있을까요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
5회 기출 질문
5회 기출 작업형 2에서3회 기출 작업형 2에서 강사님께서 풀이하신 방식으로train, test 데이터를 수치형, 범주형으로 나누고 수치형은 robustscaler, 범주형은 dummies를 활용한 후 concat으로 합치려고 했는데요!아래처럼 코딩을 했는데 사진처럼 오류가 발생합니다ㅠㅠ혹시 기출 3회 작업형 2는 회귀모형이 아니기 때문에,기출 3회 작업형 2 풀이 방식을 기출 5회 작업형 2에 활용하지 못하는건가요? import pandas as pdtrain = pd.read_csv("train.csv")test = pd.read_csv("test.csv") n_train = train.select_dtypes(exclude ='object').copyc_train = train.select_dtypes(include ='object').copyn_test = test.select_dtypes(exclude = 'object').copyc_test = test.select_dtypes(include = 'object').copy from sklearn.preprocessing import RobustScalercols = ['year', 'mileage', 'tax', 'mpg', 'engineSize']scaler = RobustScaler()n_train[cols] = scaler.fit_transform(n_train[cols])n_test[cols] = scaler.transform(n_test[cols]) c_train = pd.get_dummies(c_train)c_test = pd.get_dummies(c_test) train = pd.concat([n_train, c_train], axis=1)test = pd.concat([n_test, c_test], axis=1) print(train)print(test)