묻고 답해요
164만명의 커뮤니티!! 함께 토론해봐요.
인프런 TOP Writers
-
미해결빅데이터 분석 솔루션 TEXTOM으로 쉽고 빠르게 배우는 텍스트마이닝
텍스트마이닝 정의에 대한 인용 세부 사항
안녕하세요.강의를 잘 듣고 있습니다.아래의 인용 출처를 자세하게 알려주시면 감사하겠습니다.1강 ppt 13쪽, 텍스트마이닝 정의에 대한 인용: 'fan et al, 2006'1강 ppt 14쪽, 텍스트분석 방법: 'Bargavi et al, 2008'위에 나온 인용 출처를 좀 더 자세하게 알려주시면 감사하겠습니다.예) 저자명, 논문 이름, 연도, 논문지 이름, 책 이름, 페이지 등 감사합니다.
-
미해결[핵집] 2025 빅데이터 분석기사(필기)_과목 1~2
수업자료 통합본 부탁 드립니다.
안녕하세요. [핵집] 2023 빅데이터 분석기사(필기)_과목 1~2를 수강하고 있습니다.수업자료 통합본 발송을 부탁드리고자 합니다.[핵집] 2023 빅데이터 분석기사(필기)_과목 3-4도 같이 수강신청 했는데3-4 해당자료도 같이 부탁 드려도 되는지요.이메일 주소는 skellatte@gmail.com 입니다.감사합니다.
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
안녕하세요! 섹션 3의 ipynb 파일은 혹시 어디서 받을수 있나요?
제목 그대로입니다.ipynb 파일 url이 따로 소개가 되지 않아서 질문드려요
-
미해결[실전]텍스톰 TEXTOM 실전 강의: 빅데이터 논문 작성을 위한 텍스트 분석/텍스트마이닝
기 정제한 데이터의 영문 수정 가능 여부
강의 잘 들었습니다.그림, 표 영문 작성 논문의 경우 워드클라우드의 한글 텍스트를 영문으로 변경하고 싶은데 프로그램 내에서 변경 가능할까요?
-
미해결[실전]텍스톰 TEXTOM 실전 강의: 빅데이터 논문 작성을 위한 텍스트 분석/텍스트마이닝
n-gram에 들어갈 단어의 수 선택
n-gram에 들어갈 단어는 그 갯수를 사용자가 결정할 수 있는데, 그 수를 결정하는 데에 어떤 근거가 있을까요? 아니면 그냥 사용자가 의미있어보이는 순위까지만 사용하는건가요?
-
해결됨[핵집] 2025 빅데이터 분석기사(필기)_과목 1~2
수업자료 통합본 발송 부탁 드립니다
안녕하세요, [핵집] 2023 빅데이터 분석기사(필기)_과목 1~2 수강생 입니다.차시별 수업자료가 분리되어 있어 한꺼번에 살펴보기가 여의치 않아,수업자료 통합본 발송 부탁 드립니다.paula2021@naver.com고맙습니다!
-
미해결[실전]텍스톰 TEXTOM 실전 강의: 빅데이터 논문 작성을 위한 텍스트 분석/텍스트마이닝
분석 키워드 소거에 관하여
강의 수강생입니다.질문 내용은 제목과 같습니다.이를테면 '공무원'이라는 키워드로 분석을 실시할 경우,'공무원'이 가장 많은 빈도로 검색될텐데 이 경우 검색어는 소거하고 분석하는 게 맞는지요?
-
미해결15일간의 빅데이터 파일럿 프로젝트
zookeeper 관련 문의드립니다.
실습에서는 server01에 zookeeper 설치하고, server02에서 zookeeper-client 실행시 문제가 없는데 제환경에서는 Server01에 설치하여 server01에서만 클라이언트 실행되고, server02에서는 오류가 나는데요 정상일까요
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
실기 시험 삼수(12월 응시예정)인데, 첨으로 유료강의를 신청하여 듣게되었습니다ㅠ
제가 작년 10월에 필기를 합격하고, 첫 시험은 회사를 다닌다고 바뻐서 제대로 준비를 못했고 재수인 한달전 시험때는 대학원생 신분이 되어 너무나도 바쁘고 새로운 유형이 생겼는데 제대로 준비를 못하고 들어가서 떨어졌습니다. 시중에 나온 실기책 한권을 구매하여 보긴했으나, 구성도 엉망이고 별로여서 이대로는 잘못하다가 실기 2년 기한이 날아가버릴꺼 같아서 첨으로 빅분기 유료강의를 결제하였습니다. 데이터 진흥원 샘플문제에도 없던 회귀문제가 기출이 되었었는데, 제가 아직 강의를 듣진 않아서 다루시는지는 모르겠으나 향후 12월 시험전에 충분한 업데이트는 해주실 계획이시겠죠? 강의수를 보니 컴팩트하고 수강평도 보니 합격하신분들이 많아 신청하였습니다. 막상 시험장만 가면 2유형같은 경우에 머릿속에는 어렴풋히 프로세스가 있으나 막상 타이핑으로의 출력이 안되고, 1유형인 판다스도 매번 공식 cheatsheet를 찾아서 쓰는지라 익숙하지가 않은것 같습니다. help()함수를 써도 예시가 예상과는 다르게 나와서 활용을 못했던거 같아요. 기초부터 차근차근 강의대로 믿고 착실하게 따라 갈게요ㅠ 잘 부탁드리겠습니다
-
미해결[핵집] 2025 빅데이터 분석기사(필기)_과목 1~2
통합 강의안 요청 드립니다.
lynx561@naver.com 입니다 요청 드립니다.
-
미해결실리콘밸리 엔지니어에게 배우는 파이썬 아파치 스파크
colab에 하둡이 설치되어 있는 걸까요?
Colab에 pyspark가 미리 설치되어 있지는 않지만!pip install pyspark명령으로 설치 후 사용 가능하더라구요.Colab에 자바와 하둡, 스파크가 이미 설치되어 있는 것으로 생각해도 될까요? 제가 강의로 이해하기로는하둡에 있는 일부 기능- 맵리듀스를 스파크가 대체할 수 있는데,기존 하둡과 호환성을 위해 다른 부분은 하둡 그대로 두고 그 부분만 스파크로 대체해야 하고그래서 하둡도 필요하고 스파크는 자바로 되어 있으니 자바도 필요하고,스파크 설치 후 이것을 파이썬으로 래핑한 pyspark를 실행하는 것으로그렇게 생각하고 있는데 이게 맞는지 모르겠습니다. SparkContext가 생성되면서 내부적으로 스파크 어플리케이션이 실행되나요? 아니면 데몬같은 것이 실행중인 상태인 걸까요? 너무 모른 채로 질문드려서 죄송합니다.
-
해결됨Data Engineering Course (1) : 빅데이터 하둡 직접 설치하기
노트북 램이 8GB 인데 괜찮나요?
서버를 계속 켜두고 싶어서 사용하지 않는 노트북에 2gb ubuntu desktop을 설치했는데, 강의를 진행하는데 문제 없을까요? 해당 노트북은 다른 용도로는 전혀 사용하지 않고, 강의내용은 다른 pc에서 Xshell과 크롬 데스크톱 화면 공유를 활용하면서 실행하려고 해요.
-
미해결[핵집] 2025 빅데이터 분석기사(필기)_과목 3~4
통합 교재 문의드립니다.
안녕하세요.수강생 정종민 입니다.통합교재 공유받을수 있는지 문의드립니다.공유 가능하시다면 jasper2236@naver.com으로 공유 부탁드립니다.가입 e-mail : originaljong@lgcns.com받고 싶은 e-mail : jasper2236@naver.com감사합니다.
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
test_data로 평가할 때 pred 행 개수와 test 행개수 틀림
학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요먼저 유사한 질문이 있었는지 검색해보세요동영상: 26:30안녕하세요 trainset에서 tr, val 분류한 후 모델 설정 후 testset으로 roc_auc_score 평가를 하려고 함수를 적용했는데요pred의 행의 수와 test_set 행의 수가 다르다는 오류가 떠서요.선생님께서는 roc 평가를 할때 X_test[cols] 데이터와 X_val을 사용한 예측결과인 pred[:1]을 사용하셨는데 저는 그럼 행의 수가 다르다는 오류가 뜨네요ㅠㅠㅠ# XGBoost from xgboost import XGBClassifier xgb = XGBClassifier() xgb_fit = xgb.fit(X_tr[cols],y_tr) xgb_pred = xgb.predict_proba(X_val[cols]) from sklearn.metrics import roc_auc_score roc_auc_score(y_val,xgb_pred[:,1])# 평가 데이터로 예측 및 csv파일 생성 summit = pd.DataFrame({ "id" : X_test['id'], "income" : xgb_pred[:,1] }) summit.to_csv("1111.csv",index=False) ##############위 코드 작성으로 생긱 오류부분################ ValueError: array length 2931 does not match index length 3257
-
미해결[핵집] 2025 빅데이터 분석기사(필기)_과목 3~4
교안 요청
1~2, 3~4 모두 수강신청했습니다. julianminci@naver.com으로 부탁드립니다. 더운 날씨에 건강 조심하세요. 감사합니다.
-
해결됨[핵집] 2025 빅데이터 분석기사(필기)_과목 1~2
통합 강의안 요청드립니다.
안녕하세요 강의안(교안) 요청드립니다!dktlskdt@naver.com 으로 부탁드립니다. 감사합니다 :)
-
미해결[핵집] 2025 빅데이터 분석기사(필기)_과목 1~2
교안 발송 요청 드립니다.
오늘 수강 신청하였는데 챕터별로 강의안이 나뉘어져 있어서 한꺼번에 출력이 너무 어렵습니다. 아래 다른 게시글을 보니 통합 강의록 발송이 가능하신것 같아 요청드립니다. 통합 강의 교안 vitna821@naver.com으로 발송 요청 드립니다.
-
미해결빅데이터/텍스트마이닝 분석법 (LDA,BERTtopic,감성분석,CONCOR with ChatGPT)
강의녹화 수정요청
3:21부터 목소리가 안나옵니다.
-
미해결15일간의 빅데이터 파일럿 프로젝트
빅디님 좋은 강의 너무 감사드립니다 강의 연장 가능한지 문의드립니다
좋은 강의에 항상 신경써주셔서 감사합니다미처 수강하지 못한 부분이 있어서 수강을 하고자 합니다너무 좋은 강의에 감사드리며 요청드립니다
-
미해결스파크 머신러닝 완벽 가이드 - Part 1
spark_xgboost_lightgbm 강의부분 관련
안녕하세요. 강사님, 수업을 잘 듣고 있습니다! 다름이 아니라 spark_xgboost_lightgbm에서 버전이 바뀌면서앞선 댓글을 통해 SparkXGBClassifier로 수정하여해결은 하였으나, 새로 바뀐 XGB에서는xgb_model.feature_importances 이부분이 나오질 않아서, 혹시 SparkXGBClassifier의 featureImportances를 보려면 어떻게 해야하는지 from mmlspark.lightgbm import LightGBMClassifierimport mlflowlgbm_classifier = LightGBMClassifier(featuresCol="features", labelCol="label", numLeaves=100, maxDepth=10, numIterations=100)lgbm_model = lgbm_classifier.fit(train_sdf)-> 이부분부터 값이 나오질 않습니다.오류메시지org.apache.spark.SparkException: Job aborted due to stage failure: Task 4 in stage 73.0 failed 1 times, most recent failure: Lost task 4.0 in stage 73.0 (TID 285) (ip-번호.us-west-2.compute.internal executor driver): java.lang.NoSuchMethodError: com.microsoft.ml.lightgbm.lightgbmlib.new_doubleArray(J)Lcom/microsoft/ml/lightgbm/SWIGTYPE_p_double;이 두부분에 대해서 문의 드립니다!