묻고 답해요
160만명의 커뮤니티!! 함께 토론해봐요.
인프런 TOP Writers
-
미해결모두의 한국어 텍스트 분석과 자연어처리 with 파이썬
kkma() 실행시 kernel dead 현상이 발생합니다.
선생님께서 알려주신대로.java > jpype > konlpy 설치를 마치고그 다음 진도를 진행하려 하는데kkma = Kkma()를 실행하는 순간 kernel dead 메시지가 나면서더이상 실행이 안됩니다. googling을 통해서 여러 해법을찾아 보았지만, 해결이 안되고 있는데요... 도움 부탁드립니다.jupyter_notebook의 config 파일 생성 후... buffer_size 도10000000000 으로 상향 조정하는 등의 방법을 써도 해결되지가 않습니다.
-
미해결실무자를 위한 구글애널리틱스(GA4+GTM) 활용법(25년 Update)
실무에 적용할 때 unknown 값이 너무 많아 신뢰할 수 없을 때
실무에 적용할 때 unknown 값이 너무 많아 신뢰할 수 없을 때, 어떻게 조금이나마 개선해서 풀어낼 수 있을까요?실제DB의 값과 애널리틱스에 수집되는 인구통계 정보를 연결시켜주는 작업이 가능한가요?아니면 unknown 측정 비중을 줄일 수 있는 방법이 없을까요?
-
미해결실무자를 위한 구글애널리틱스(GA4+GTM) 활용법(25년 Update)
데모계정 카테고리가 다릅니다
1) 데모계정에 인구통계 카테고리가 나타나지 않습니다.뭐가 잘못된 것일까요?2) 예전에 구글 아이디로 UA를 실습한적이 있습니다. 그 계정이 아닌 다른 계정으로 최근에 카페 24 홈페이지를 만들어서 다시 데모계정을 만들었는데.. 뭔가 이상해서.. 또 다른 구글 게정을 새롭게 만들어서 다시 데모계정을 만들었는데.. 최초의 구글 아이디로만 계속 보여집니다.어떻게 해결해야할까요? 다 지우고 새롭게 처음부터 다시 시작하고 싶습니다. 너무 헷갈리네요. ㅠㅠ
-
미해결모두의 한국어 텍스트 분석과 자연어처리 with 파이썬
설문조사 주관식 데이터 처리방법 문의
이전에 고객 설문데이터를 가지고 보고서를 만들었던 경험이 있습니다.객관식은 전체 응답기준으로 엑셀로 매크로를 이용하여 그래프를 만들면 되는데문제는 주관식입니다.주관식은 요약을 보고서에 담아야 되어서, 전체를 읽어보고 전체 의견요약을 하고,긍정의견, 부정의견을 나누고 그에 대한 요약을 작성을 일일이 사람이 전체를 읽어서 처리를 합니다.건수가 작으면 혼자 하면 되는데 20만건 데이터 처리는 혼자는 하기 힘들고 여러명이 나눠서 해야만 됩니다. 데이터가 많을 경우 ChatGPT로 요약을 해보니 최대 처리할 수 있는 데이터 크기가 32k까지 밖에 처리가 되지 않아 몇%만 샘플링해서 요약하는 방법밖에 없었습니다. 그럼 샘플링에 따라서 고객의견이 정확하게 반영이 되 지않아 결국은 여러명이 수작업으로 진행했습니다. 자연어 처리로 자동으로 긍정, 부정을 분류까지는 가능할것도 같은데 분류된 데이터 가지고 긍정의견의 요약, 부정의견의 요약을 딥러닝으로 해결이 가능할까요?아니면 어떤 좋은 방법이 있을까요?
-
해결됨PM을 위한 데이터 리터러시(프로덕트 데이터 분석)
강의 수강 관점에 관련한 고민
안녕하세요! 강의를 수강하며 고민이 생겨 이렇게 글을 작성하게 되었습니다. 저는 강의 수강을 시작할 당시 학생으로 데이터 분야 중 특히 데이터 분석에 가장 큰 관심을 갖고 공부를 하고자 했습니다. 하지만 현재 우연한 기회로 데이터 엔지니어로 취업하게 되었고, 데이터 파이프라인 구축, ETL, 대시보드 설계를 위주로 업무를 배우고 있는 한달차 신입입니다….ㅎㅎ 현재 저의 상황에서 카일님의 PM을 위한 데이터 리터러시 강의를 어떤 관점으로 수강하는 것이 도움이 될지에 대한 고민이 생겨 이렇게 질문을 남깁니다. 좋은 강의 감사합니다!
-
미해결데이터분석에 ChatGPT 강림
Chat GPT 분석 에러 문의
안녕하세요, 강사님강의를 들으면서 Chat GPT에 바로 적용해보고 있는데요.다음과 같은 질문을 했을 때, Chat GPT에서 분석 오류가 뜨는데, 해결 방법이 있을까요?[질문]1. 데이터셋에 있는 범주형 변수를 원-핫 인코딩으로 변환해주세요."범주형 변수 변환 후, 모델 학습에 어떤 영향을 미치는지 설명해줄 수 있나요?"2. 원-핫 인코딩 후의 데이터 구조와 변화된 값들을 보여주세요.[응답]죄송합니다, 원-핫 인코딩을 수행하는 과정에서 기술적 문제가 지속적으로 발생하고 있습니다. 이로 인해 현재로서는 원-핫 인코딩 후의 데이터 구조와 변화된 값을 직접 보여드릴 수 없습니다.[질문]1. 'Fare'변수에서 이상치를 어떻게 처리할지 추천해주세요.2. Chat GPT가 추천하는 이상치 처리 후 데이터셋의 변화를 보여주세요.[응답]현재 기술적인 문제로 인해 'Fare' 변수의 이상치 처리 후 데이터셋의 변화를 직접 보여드릴 수 없습니다. 하지만, 이상치를 처리하는 추천 방법에 대해 설명드릴 수 있습니다:[질문]그러면 너가 추천하는 모델로 모델링을 해주고, 성능이 어떻게 나왔는지 정리해줘. *결과에 대해서는 표로 정리해줘[응답]현재 기술적인 문제로 인해 모델링을 직접 실행하고 그 결과를 보여드리는 것이 어렵습니다. 그러나 일반적으로 랜덤 포레스트 모델을 사용하여 타이타닉 데이터셋에 대한 생존 예측을 수행하고 성능을 평가하는 과정을 설명드릴 수 있습니다.[질문]"우리의 모델이 얼마나 성능이 좋은지 Test 데이터를 통해 확인해줘"[응답]현재 제가 직접 모델링을 수행하거나 테스트 데이터를 사용하여 모델의 성능을 평가하는 것은 불가능합니다. 그러나 일반적인 머신 러닝 프로젝트에서 테스트 데이터를 사용하여 모델의 성능을 평가하는 과정을 설명드릴 수 있습니다. 유료버젼 Chat GPT 4 결제해서 사용하는데도 안되는게 많아서 걱정입니다..
-
해결됨실무자를 위한 구글애널리틱스(GA4+GTM) 활용법(25년 Update)
utm을 넣었지만 referral로 확인되는 경우
선생님, 안녕하세요.카페24로 실습해서 utm을 넣었습니다.주소 뒷부분 utm : ?utm_source=youtube&utm_medium=PowerYT_video&utm_campaign=2024_PowerYT&utm_content=yt_3애널리틱스의 획득 > 트래픽 획득 보고서 내에 소스/매체가 이렇게 확인이 됩니다.혹시 어떤게 문제였을 지 알 수 있을까요?
-
해결됨실무자를 위한 구글애널리틱스(GA4+GTM) 활용법(25년 Update)
utm content로 데이터 확인하는 방법
안녕하세요, 선생님.utm contents는 +버튼 누르고 '수동'을 검색해야 나온다고 하셨는데.. 저는 수동 검색하니까 아무것도 안뜹니다.'세션 광고 소재 형식'로 대체해서 클릭하면 되는걸까요~?그리고 수동 검색어는 어떻게 보면 될까요?
-
미해결실무자를 위한 구글애널리틱스(GA4+GTM) 활용법(25년 Update)
데모계정 화면이 약간 달라요!
안녕하세요, 강사님.Google 애널리틱스 4 속성: Google Merchandise Store(웹 데이터) 로 들어왔는데 강의 화면과 약간 달라서 질문 드려요1. 위쪽에 merchandise가 표시되어 있지 않아도 괜찮나요?(클릭하면 daisy_world. visit 이렇게 나옵니다)2. 보고서 하단에 라이브러리가 안보입니다.
-
미해결실무자를 위한 구글애널리틱스(GA4+GTM) 활용법(25년 Update)
GA4 태그 구성
안녕하세요~ 태그 관리자에서 태그 등록하려고 하는데 웹 속성 ID에 G-******* 코드 입력 시 '추적 ID는 UA-XXXXX-X 형식이어야 합니다.'라는 문구가 뜨며 저장 자체가 안되는데 어떻게 해야 될까욥?
-
미해결모두의 한국어 텍스트 분석과 자연어처리 with 파이썬
감성분석
강사님 안녕하세요. 책보면서 강의 열심히 듣고 있습니다. 제가 한국어 텍스트 감성분석을 프로젝트로 하고 싶은데요.현 강의 목차에는 감성분석이 없더라고요.제가 놓친 걸까요?이번 강의에서 감성분석을 다루는 부분이 있다면 알려주시면 감사하겠습니다.아직 없다면, 감성분석 강의도 듣고 싶습니다.항상 감사합니다:)!
-
미해결모두의 한국어 텍스트 분석과 자연어처리 with 파이썬
해당 강의 내용 영문에 적용하는 방법
한국어 분석 말고, 영어 분석은 어떻게 다른지 업데이트 해주 실수 있을까요?
-
해결됨PM을 위한 데이터 리터러시(프로덕트 데이터 분석)
수강 목표
저는 프로덕트 디자이너입니다. 데이터를 잘 다루기로 유명한 회사에서 최근 면접을 봤고 합격했습니다. 면접 중 데이터에 대한 질문에서 대답을 명료히 하지 못했고 개선이 필요하다 생각해 해당 강의를 수강하게 되었습니다. 저는 해당 강의를 수강하고 아래 3가지를 꼭 얻고 싶습니다. 데이터를 실무에서 활용하는 방법데이터로 동료들과 협업하는 방법데이터 애널리스트와 협업하는 방법강의 수강과 복습, 연습을 꾸준히 해보려고 합니다. 적어도 입사 전까지 세션 4까지 완강하고 들어가고 싶어요! 입사 후에도 꾸준히 강의 노트를 보며 실무에 활용해보려 합니다. 완강한 후 저는 PM 만큼이나 데이터를 잘 보고 활용하는 프로덕트 디자이너가 되고 싶습니다. 잘 부탁드려요!
-
해결됨실무자를 위한 구글애널리틱스(GA4+GTM) 활용법(25년 Update)
GA4 기본태그 구성 내 태그 유형 선택 문의 / 강의시간(9:21)
안녕하세요, 선생님.제 화면에서는 Google 애널리틱스 : GA4 구성이 따로 없는데 어떻게 선택해야 하나요?
-
미해결모두의 한국어 텍스트 분석과 자연어처리 with 파이썬
PDF기준으로 LLM에게 답변/요약을 요청할때 가능한 방법 문의
여러개의 pdf 파일기준으로 LLM에게 답변하거나 요약하라고 할때pdf 데이터를 vectordb에 임베딩하여 조회하는 방법만 알고있었는데 pdf를 txt로 변환후에 langchain 함수를 이용하고 vectordb를 이용하지 않아도LLM이용하여 답변이 가능하던데요. 어떤게 좋은 방법일까요?from langchain.chains.question_answering import load_qa_chainfrom langchain.chains import AnalyzeDocumentChainqa_chain = load_qa_chain(model, chain_type="map_reduce")qa_document_chain = AnalyzeDocumentChain(combine_docs_chain=qa_chain) 데이터가 많으면 vectordb를 쓰고, 많지 않으면 langchain 함수를 이용하는건가요?다른 방법은 또 어떤게 있을까요?
-
미해결TEXTOM SV로 해보는 빅데이터 분석 (정제부터 시각화까지)
concor 분석
UCINET프로그램을 활용한 분석을 교육 영상을 보며 연습하고 있었습니다. concor 분석을 하는 과정에서 input dataset 입력한 후 output dataset을 3가지 입력하는 과정에서 문제가 발생합니다. 폴더를 열면 파일형식에 Datasets로만 뜨네요. 교육 영상처럼Datasets(*.##h)라고 뜨지 않네요. 그래서 오류가 나는 것 같은데...이럴 결우 어떻게 해야 하나요? 폴더 속 문서는 모두(*.##h)로 뜹니다.
-
해결됨PM을 위한 데이터 리터러시(프로덕트 데이터 분석)
4-2. 지표의 개념
안녕하세요~Input metric은 선행지표, Output metric은 후행지표와 동일한 개념으로 이해하면 될까요? Input/Output metric과 선행/후행지표 간 개념 차이가 있다면 설명해주시면 감사하겠습니다~!
-
미해결데이터분석에 ChatGPT 강림
강의 자료 관련입니다.
강의를 통해서 막연했던 챗gpt 활용 데이터 분석에 큰 도움을 받고 있습니다. 초보자도 알기 쉽게 설명해주셔서 감사해요! 다름이 아니라, 데이터 분석과정에 활용하는 유용한 프롬프트를 많이 알려주시는데요. 별도로 강의자료가 없다보니 강의 도중 캡쳐나 필기를 해야하고, 나중에 찾아보기 힘든 부분이 있습니다. 별도 강의자료 제공 계획은 없으신지 궁금합니다. 감사합니다.
-
미해결실무자를 위한 구글애널리틱스(GA4+GTM) 활용법(25년 Update)
클릭이벤트_셋팅실습1 강의 관련 질문
세팅 다 하고 ga4에 와서 실시간 리포트 보는데저는 매개변수가 이벤트 이름별 이벤트 수에 하나도 안나오네요 ㅜ 왜그런걸까요? 태그 구성에서 강의 화면이랑 다른게 구성태그는 없고 왠 측정ID가 나오는데 이거때문인가요?
-
해결됨PM을 위한 데이터 리터러시(프로덕트 데이터 분석)
6-7 데이터로그설계 연습 문제
안녕하세요, 선생님! 연습문제를 풀고 구글 스프레드 시트와 블로그에 정리해두었어요.검색 필터 기능 로그 지표 부분에서 질문이 있어 스프레드시트 event컬럼에 초록색으로 표기해두었는데요1) 검색필터 기본, 주문 많은 순, 배달 빠른 순 등등 세분화된 필터를 파라미터에 명시해두는 것이 나을지2) 파라미터단에는 filter_name, filter_id 정도로 명시해두고 value에서 설명을 달아두는 것이 나을지 헷갈리더라구요.1안과 2안 중 어떤 것이 업무에서 효율적인지 그렇다면 이유가 무엇인지 궁금합니다! 감사합니다. 새해 복 많이 받으세요!