묻고 답해요
161만명의 커뮤니티!! 함께 토론해봐요.
인프런 TOP Writers
-
미해결모두의 한국어 텍스트 분석과 자연어처리 with 파이썬
설문조사 주관식 데이터 처리방법 문의
이전에 고객 설문데이터를 가지고 보고서를 만들었던 경험이 있습니다.객관식은 전체 응답기준으로 엑셀로 매크로를 이용하여 그래프를 만들면 되는데문제는 주관식입니다.주관식은 요약을 보고서에 담아야 되어서, 전체를 읽어보고 전체 의견요약을 하고,긍정의견, 부정의견을 나누고 그에 대한 요약을 작성을 일일이 사람이 전체를 읽어서 처리를 합니다.건수가 작으면 혼자 하면 되는데 20만건 데이터 처리는 혼자는 하기 힘들고 여러명이 나눠서 해야만 됩니다. 데이터가 많을 경우 ChatGPT로 요약을 해보니 최대 처리할 수 있는 데이터 크기가 32k까지 밖에 처리가 되지 않아 몇%만 샘플링해서 요약하는 방법밖에 없었습니다. 그럼 샘플링에 따라서 고객의견이 정확하게 반영이 되 지않아 결국은 여러명이 수작업으로 진행했습니다. 자연어 처리로 자동으로 긍정, 부정을 분류까지는 가능할것도 같은데 분류된 데이터 가지고 긍정의견의 요약, 부정의견의 요약을 딥러닝으로 해결이 가능할까요?아니면 어떤 좋은 방법이 있을까요?
-
해결됨PM을 위한 데이터 리터러시(프로덕트 데이터 분석)
강의 수강 관점에 관련한 고민
안녕하세요! 강의를 수강하며 고민이 생겨 이렇게 글을 작성하게 되었습니다. 저는 강의 수강을 시작할 당시 학생으로 데이터 분야 중 특히 데이터 분석에 가장 큰 관심을 갖고 공부를 하고자 했습니다. 하지만 현재 우연한 기회로 데이터 엔지니어로 취업하게 되었고, 데이터 파이프라인 구축, ETL, 대시보드 설계를 위주로 업무를 배우고 있는 한달차 신입입니다….ㅎㅎ 현재 저의 상황에서 카일님의 PM을 위한 데이터 리터러시 강의를 어떤 관점으로 수강하는 것이 도움이 될지에 대한 고민이 생겨 이렇게 질문을 남깁니다. 좋은 강의 감사합니다!
-
미해결데이터분석에 ChatGPT 강림
Chat GPT 분석 에러 문의
안녕하세요, 강사님강의를 들으면서 Chat GPT에 바로 적용해보고 있는데요.다음과 같은 질문을 했을 때, Chat GPT에서 분석 오류가 뜨는데, 해결 방법이 있을까요?[질문]1. 데이터셋에 있는 범주형 변수를 원-핫 인코딩으로 변환해주세요."범주형 변수 변환 후, 모델 학습에 어떤 영향을 미치는지 설명해줄 수 있나요?"2. 원-핫 인코딩 후의 데이터 구조와 변화된 값들을 보여주세요.[응답]죄송합니다, 원-핫 인코딩을 수행하는 과정에서 기술적 문제가 지속적으로 발생하고 있습니다. 이로 인해 현재로서는 원-핫 인코딩 후의 데이터 구조와 변화된 값을 직접 보여드릴 수 없습니다.[질문]1. 'Fare'변수에서 이상치를 어떻게 처리할지 추천해주세요.2. Chat GPT가 추천하는 이상치 처리 후 데이터셋의 변화를 보여주세요.[응답]현재 기술적인 문제로 인해 'Fare' 변수의 이상치 처리 후 데이터셋의 변화를 직접 보여드릴 수 없습니다. 하지만, 이상치를 처리하는 추천 방법에 대해 설명드릴 수 있습니다:[질문]그러면 너가 추천하는 모델로 모델링을 해주고, 성능이 어떻게 나왔는지 정리해줘. *결과에 대해서는 표로 정리해줘[응답]현재 기술적인 문제로 인해 모델링을 직접 실행하고 그 결과를 보여드리는 것이 어렵습니다. 그러나 일반적으로 랜덤 포레스트 모델을 사용하여 타이타닉 데이터셋에 대한 생존 예측을 수행하고 성능을 평가하는 과정을 설명드릴 수 있습니다.[질문]"우리의 모델이 얼마나 성능이 좋은지 Test 데이터를 통해 확인해줘"[응답]현재 제가 직접 모델링을 수행하거나 테스트 데이터를 사용하여 모델의 성능을 평가하는 것은 불가능합니다. 그러나 일반적인 머신 러닝 프로젝트에서 테스트 데이터를 사용하여 모델의 성능을 평가하는 과정을 설명드릴 수 있습니다. 유료버젼 Chat GPT 4 결제해서 사용하는데도 안되는게 많아서 걱정입니다..
-
해결됨실무자를 위한 구글애널리틱스(GA4+GTM) 활용법(25년 Update)
utm을 넣었지만 referral로 확인되는 경우
선생님, 안녕하세요.카페24로 실습해서 utm을 넣었습니다.주소 뒷부분 utm : ?utm_source=youtube&utm_medium=PowerYT_video&utm_campaign=2024_PowerYT&utm_content=yt_3애널리틱스의 획득 > 트래픽 획득 보고서 내에 소스/매체가 이렇게 확인이 됩니다.혹시 어떤게 문제였을 지 알 수 있을까요?
-
해결됨실무자를 위한 구글애널리틱스(GA4+GTM) 활용법(25년 Update)
utm content로 데이터 확인하는 방법
안녕하세요, 선생님.utm contents는 +버튼 누르고 '수동'을 검색해야 나온다고 하셨는데.. 저는 수동 검색하니까 아무것도 안뜹니다.'세션 광고 소재 형식'로 대체해서 클릭하면 되는걸까요~?그리고 수동 검색어는 어떻게 보면 될까요?
-
미해결실무자를 위한 구글애널리틱스(GA4+GTM) 활용법(25년 Update)
데모계정 화면이 약간 달라요!
안녕하세요, 강사님.Google 애널리틱스 4 속성: Google Merchandise Store(웹 데이터) 로 들어왔는데 강의 화면과 약간 달라서 질문 드려요1. 위쪽에 merchandise가 표시되어 있지 않아도 괜찮나요?(클릭하면 daisy_world. visit 이렇게 나옵니다)2. 보고서 하단에 라이브러리가 안보입니다.
-
미해결실무자를 위한 구글애널리틱스(GA4+GTM) 활용법(25년 Update)
GA4 태그 구성
안녕하세요~ 태그 관리자에서 태그 등록하려고 하는데 웹 속성 ID에 G-******* 코드 입력 시 '추적 ID는 UA-XXXXX-X 형식이어야 합니다.'라는 문구가 뜨며 저장 자체가 안되는데 어떻게 해야 될까욥?
-
미해결모두의 한국어 텍스트 분석과 자연어처리 with 파이썬
감성분석
강사님 안녕하세요. 책보면서 강의 열심히 듣고 있습니다. 제가 한국어 텍스트 감성분석을 프로젝트로 하고 싶은데요.현 강의 목차에는 감성분석이 없더라고요.제가 놓친 걸까요?이번 강의에서 감성분석을 다루는 부분이 있다면 알려주시면 감사하겠습니다.아직 없다면, 감성분석 강의도 듣고 싶습니다.항상 감사합니다:)!
-
미해결모두의 한국어 텍스트 분석과 자연어처리 with 파이썬
해당 강의 내용 영문에 적용하는 방법
한국어 분석 말고, 영어 분석은 어떻게 다른지 업데이트 해주 실수 있을까요?
-
해결됨PM을 위한 데이터 리터러시(프로덕트 데이터 분석)
수강 목표
저는 프로덕트 디자이너입니다. 데이터를 잘 다루기로 유명한 회사에서 최근 면접을 봤고 합격했습니다. 면접 중 데이터에 대한 질문에서 대답을 명료히 하지 못했고 개선이 필요하다 생각해 해당 강의를 수강하게 되었습니다. 저는 해당 강의를 수강하고 아래 3가지를 꼭 얻고 싶습니다. 데이터를 실무에서 활용하는 방법데이터로 동료들과 협업하는 방법데이터 애널리스트와 협업하는 방법강의 수강과 복습, 연습을 꾸준히 해보려고 합니다. 적어도 입사 전까지 세션 4까지 완강하고 들어가고 싶어요! 입사 후에도 꾸준히 강의 노트를 보며 실무에 활용해보려 합니다. 완강한 후 저는 PM 만큼이나 데이터를 잘 보고 활용하는 프로덕트 디자이너가 되고 싶습니다. 잘 부탁드려요!
-
해결됨실무자를 위한 구글애널리틱스(GA4+GTM) 활용법(25년 Update)
GA4 기본태그 구성 내 태그 유형 선택 문의 / 강의시간(9:21)
안녕하세요, 선생님.제 화면에서는 Google 애널리틱스 : GA4 구성이 따로 없는데 어떻게 선택해야 하나요?
-
미해결모두의 한국어 텍스트 분석과 자연어처리 with 파이썬
PDF기준으로 LLM에게 답변/요약을 요청할때 가능한 방법 문의
여러개의 pdf 파일기준으로 LLM에게 답변하거나 요약하라고 할때pdf 데이터를 vectordb에 임베딩하여 조회하는 방법만 알고있었는데 pdf를 txt로 변환후에 langchain 함수를 이용하고 vectordb를 이용하지 않아도LLM이용하여 답변이 가능하던데요. 어떤게 좋은 방법일까요?from langchain.chains.question_answering import load_qa_chainfrom langchain.chains import AnalyzeDocumentChainqa_chain = load_qa_chain(model, chain_type="map_reduce")qa_document_chain = AnalyzeDocumentChain(combine_docs_chain=qa_chain) 데이터가 많으면 vectordb를 쓰고, 많지 않으면 langchain 함수를 이용하는건가요?다른 방법은 또 어떤게 있을까요?
-
미해결TEXTOM SV로 해보는 빅데이터 분석 (정제부터 시각화까지)
concor 분석
UCINET프로그램을 활용한 분석을 교육 영상을 보며 연습하고 있었습니다. concor 분석을 하는 과정에서 input dataset 입력한 후 output dataset을 3가지 입력하는 과정에서 문제가 발생합니다. 폴더를 열면 파일형식에 Datasets로만 뜨네요. 교육 영상처럼Datasets(*.##h)라고 뜨지 않네요. 그래서 오류가 나는 것 같은데...이럴 결우 어떻게 해야 하나요? 폴더 속 문서는 모두(*.##h)로 뜹니다.
-
해결됨PM을 위한 데이터 리터러시(프로덕트 데이터 분석)
4-2. 지표의 개념
안녕하세요~Input metric은 선행지표, Output metric은 후행지표와 동일한 개념으로 이해하면 될까요? Input/Output metric과 선행/후행지표 간 개념 차이가 있다면 설명해주시면 감사하겠습니다~!
-
미해결데이터분석에 ChatGPT 강림
강의 자료 관련입니다.
강의를 통해서 막연했던 챗gpt 활용 데이터 분석에 큰 도움을 받고 있습니다. 초보자도 알기 쉽게 설명해주셔서 감사해요! 다름이 아니라, 데이터 분석과정에 활용하는 유용한 프롬프트를 많이 알려주시는데요. 별도로 강의자료가 없다보니 강의 도중 캡쳐나 필기를 해야하고, 나중에 찾아보기 힘든 부분이 있습니다. 별도 강의자료 제공 계획은 없으신지 궁금합니다. 감사합니다.
-
미해결실무자를 위한 구글애널리틱스(GA4+GTM) 활용법(25년 Update)
클릭이벤트_셋팅실습1 강의 관련 질문
세팅 다 하고 ga4에 와서 실시간 리포트 보는데저는 매개변수가 이벤트 이름별 이벤트 수에 하나도 안나오네요 ㅜ 왜그런걸까요? 태그 구성에서 강의 화면이랑 다른게 구성태그는 없고 왠 측정ID가 나오는데 이거때문인가요?
-
해결됨PM을 위한 데이터 리터러시(프로덕트 데이터 분석)
6-7 데이터로그설계 연습 문제
안녕하세요, 선생님! 연습문제를 풀고 구글 스프레드 시트와 블로그에 정리해두었어요.검색 필터 기능 로그 지표 부분에서 질문이 있어 스프레드시트 event컬럼에 초록색으로 표기해두었는데요1) 검색필터 기본, 주문 많은 순, 배달 빠른 순 등등 세분화된 필터를 파라미터에 명시해두는 것이 나을지2) 파라미터단에는 filter_name, filter_id 정도로 명시해두고 value에서 설명을 달아두는 것이 나을지 헷갈리더라구요.1안과 2안 중 어떤 것이 업무에서 효율적인지 그렇다면 이유가 무엇인지 궁금합니다! 감사합니다. 새해 복 많이 받으세요!
-
해결됨PM을 위한 데이터 리터러시(프로덕트 데이터 분석)
4-8 지표 정의하기 연습문제
안녕하세요 🙂 연말을 불태우면서 열심히 공부하고 있는 수강생입니다. Product 분석에 관심이 생겨 열심히 수강을 하고 있는데, 4-8 지표 정의하기 연습문제 제 나름대로의 풀이를 전달드립니다. 저는 기본적으로 목적 -> 예상 문제를 정의하고 지표와 선정사유를 기입해두었는데요. 이러한 사고방식이 맞나 싶기도 합니다. 다음과 같이 전달드립니다. 지표 정의하기 문제 1. 기능은 잘 작동이 되고 있나요…?목적 : 지표를 통하여 고객들이 홈화면에서 자사에서 의도한 최종 목적까지 원활하게 서비스를 이용하는지 파악이 필요하다.예상 문제 정의 :홈 화면에서 특정 기능은 너무 복잡한 UX/UI로 인해 관심도가 떨어지고, 고객에게 번거로움만 줄 것이다. 이로 인하여 고객이 이탈하게 된다.배너에서 고객이 선호하는 배너 노출이 있을 것이며, 이에 따라 CTR의 지표가 증감하며, 고객 이탈의 원인이 있을 것이다.첫 화면에서 메뉴 노출 카테고리가 고객의 선호도에 맞게 설정이 되어 있지 않다. 이로 인하여 고객이 이탈하게 된다.지표 및 선정 사유첫 세션 방문자 기준 CTR첫 퍼널 & 고객 선호 기능 파악을 하는 의도첫 세션 클릭이 배너/메뉴 카테고리/ 이런 음식 어때요 / 동네 맛집 기능인 고객의 방문페이지 당 전환 수/ 고객 당 전환 수방문 페이지 당 전환이 낮을 경우 이를 통하여 전환까지의 Funnel에 문제가 있음을 발견 ex) 계속 여러 화면을 통하여 고객의 Funnel이 길어지는 현상고객 당 전환수를 통하여 방문 페이지 당 전환수와 대비하여 Funnel 개선을 통하여 전환 수를 크게 바꿀 수 있는지를 검증 지표 정의하기 문제 2. 검색 만족도 지표 목적 : 배달 서비스 관련하여 고객이 검색 기능에 만족을 했는지 파악하고 싶다.예상 문제 정의 고객이 검색 기능을 통하여 원하는 음식을 빠르게 찾고, 주문을 할 수 있었다면 검색의 기능이 원활하게 작동하고 있는 것이다.지표 및 선정 사유세션 방문 대비 고객의 검색 기능 활용 빈도 / 재활용 고객 분포고객이 검색 기능을 통해 배달 음식을 찾아내는지 빈도를 알아낼 수 있음검색 기능을 활용한 고객 주문 전환율최종적으로 고객의 전환이 이루어졌는지 확인할 수 있음 지표 정의하기 문제 3. 검색 필터 기능의 활성화 지표 목적 : 고객이 검색 필터를 통하여 원하는 정보를 찾을 수 있는지 확인해보고 싶다.예상 문제 정의 고객이 검색 필터를 잘 활용하고 있다면, 필터 사용 이후 원하는 음식을 찾고 전환까지 진행했을 것이다.지표 및 선정 사유고객의 필터 기능 활용 빈도고객이 필터 기능을 통해 배달 음식을 찾아내는지 빈도를 알아낼 수 있음필터 내, 정렬 기능 별 클릭 수 고객이 어떤 기준으로 정렬을 하는지 선호도 파악을 위한 지표 지표 정의하기 문제 4. 배달 서비스에서 가장 중요한 지표는? 목적 : 배달 서비스에서 가장 중요한 지표를 찾고 싶다. 예상 문제 정의 고객의 입장에서 100점짜리 배달서비스는 저렴한 가격/ 신속 배달 / 맛있는 음식점만 선별 되는 배달 서비스일 것이다.배달서비스에서 100점짜리 고객은 한번 구매 이후 계속해서 서비스를 이용하며 Cross-sell / Up-sell이 일어나는 고객일 것이다.지표 및 선정 사유Retention & 평균 구매 주기고객이 지속적으로 떠나지 않고 우리 서비스를 이용하는 지, 판단구매 주기를 통하여 Retention의 기간을 어떻게 잡아야할지 판단. 지표 정의하기 문제 5. 추천 알고리즘의 성능 지표 목적 : 추천 알고리즘의 성능을 나타낼 수 있는 지표를 알고 싶다.예상 문제 정의 알고리즘이 잘 작동한다면, 고객의 전환율이 높아지고 있을 것이다.알고리즘이 잘 작동한다면, 고객의 Cross-sell/Up-sell 빈도가 높아지고 있을 것이다.지표 및 선정 사유추천 알고리즘을 통한 주문 전환율 / Up-sell / Cross-sell 고객 비중추천 알고리즘은 연관 제품을 통하여 Up-sell / Cross-sell을 유도하는데 목적이 있다고 판단 따라서 고객군 별 전환 차이를 통하여 효과를 검증할 수 있을 것 지표 정의하기 문제 6. 여러분들이 자주 사용하는 서비스의 지표 여기에서는 제가 가장 많이 사용하는 서비스인 토스 증권를 예시로 들겠습니다.목적 : 토스 증권에서 가장 중요시 하는 지표를 찾아낸다예상 문제 정의 토스 증권에서 핵심적인 수익은 주식을 팔고 사는 것에 대한 수수료이다.주식에 대한 관심도를 높이고 쉽게 거래를 할 수 있으면 거래량이 늘어날 것이다.정기적인 거래를 거래를 할 수 있다면 주식 거래 습관이 형성할 수 있을 것이다.지표 및 선정 사유고객 당 일/월별 거래량기본적이 고객의 주식 거래 빈도를 통해 고객군이 어떻게 형성되어 있는지 확인할 수 있다.정기 구매 주식 서비스 사용 빈도정기적으로 습관이 형성된 고객군을 분리할 수 있으며, 서비스의 만족도가 높은 고객으로 판단할 수 있다.주식 컨텐츠 CTR 및 주식 컨텐츠를 통한 CVR주식에 대한 관심도가 높아진 것으로 판단할 수 있으며, 콘텐츠를 통하여 주식 거래 전환을 유도할 수 있는지 판단 지표 정의하기 문제 7. 퍼널 개선 프로젝트 목적 : 가입 퍼널 개선을 위해서 퍼널 분석을 통해 문제점을 찾아낸다.예상 문제 정의 각 퍼널은 다운로드 -> 회원가입 클릭 -> 정보 입력 -> 회원 가입 완료로 이루어진다.특정 퍼널에서 이탈이 많이 이루어 지고 있다. 특히 정보 입력에서 문제점이 있는 것으로 확인이 된다.정보 입력 퍼널 내에서 간소화 하기 위하여 간편 가입 시스템을 도입한다.지표 및 선정 사유각 퍼널별 이탈률 & 회원가입 전환율앞선 문제에서 개선한 부분이 잘 반영이 되었고, 고객에게 효과가 있었는지 검증. 부족한 부분도 많은데, 많이 배우고 있습니다 🙂 감사합니다
-
미해결실무자를 위한 구글애널리틱스(GA4+GTM) 활용법(25년 Update)
날짜 비교 기간 선택 방법 질문드립니다!
날짜 비교 선택할때 비교 날짜 필드 먼저 클릭하고 달력에 날짜 선택하면비교 날짜가 바뀌는게 아니라 맞춤 설정 부분 날짜가 변경되는데 왜그러는걸까요? ㅜㅜ
-
미해결실무자를 위한 구글애널리틱스(GA4+GTM) 활용법(25년 Update)
광고 리포트_기여분석_모델비교 리포트 강의 질문드립니다!
기여 분석 모델 기준이 마지막 클릭만 뜨는 이유가 뭘까요? 강의에는 첫번째클릭,선형,위치기반 이런것들이 보이는데제가 보는 화면에는 항목이 아예 안뜨네요