🙌 소개
안녕하세요. 거칠지만 정말 유익한 데이터 분석가 "거친코딩" 입니다.
고려대학교 통계학과 (졸업)
고려대학교 대학원 빅데이터융합학과 (재학)
QS 세계대학평가 평가위원
고려대학교 SW 중심대학 인공지능 심화 수료
고려대학교 KUCC(컴퓨터 동아리) 세션장
고려대학교 학과 5회 수석, 1회 전체 수석
빅데이터분석기사 자격증
빅데이터분석 준전문가(adsp) 자격증
저는 현재 "네카 중 한 곳"에서 파이썬 및 시각화툴(Tableau)를 활용하여 데이터 수집, 가공, 분석, 예측, 시각화, 업무 자동화를 하고 있습니다.
⭐️ 멘토링
데이터 분석 직무를 꿈꾸는 학생들을 위한 효율적 공부법
데이터 분석 현업에 있는 주니어 분석가를 위한 상담
현업에서 IT직군이 아니지만, IT 기술을 활용하여 본인 업무에 적용하고 싶은 분
🌈 멘토링 진행 방식
zoom을 통한 비대면 방식 진행
준비물 : 컴퓨터, 카메라, 이어폰
미리 준비한 질문 사항 혹은 현 상황에 따라 멘토링 진행
🐯 마무리 글
모든 일에는 시작이 가장 중요합니다. 뜨거운 열정으로 이루고자 하는 것을 꼭 이뤄냅시다!..
📨 메일문의
rough_coding@naver.com
Courses
Reviews
- The Complete Guide to AB Testing
- Machine learning starting from Python's basic libraries
- Machine learning starting from Python's basic libraries
- The Complete Guide to AB Testing
- Machine learning starting from Python's basic libraries
Posts
Q&A
코드 공유 폴더가 비어 있습니다.
안녕하세요.방금 다운로드 테스트 해봤는데,아래와 같이 정상적으로 파일들이 들어있습니다.다른 기기에서도 동일한 현상이 발생하면 한번더 말씀해주세요.감사합니다.(사진)
- 0
- 1
- 21
Q&A
샘플 사이즈 문의
안녕하세요.질문주신 부분에 대한 답변을 드립니다.1. 오프라인 매장에서의 Base-metric과 Expected-metric오프라인 매장에서는 매출이 주요 성과 지표로 사용될 수 있습니다.Base-metric: 기존 매출 (e.g., 현재 일평균 매출)Expected-metric: 매출 변화율 (e.g., 추가 제품 공급으로 인해 예상되는 상승 비율)다만, 매출은 온라인의 CVR/CTR과 달리 이산형 데이터가 아니라 연속형 데이터로, 정규분포를 따를 가능성이 더 큽니다. 이 경우, CVR/CTR에서 사용하는 비율 기반의 공식은 적합하지 않을 수 있습니다. 2. 샘플사이즈 계산 오류의 원인문의 주신 공식은 이항 분포 기반 데이터(예: 클릭 여부, 구매 여부)에서 활용됩니다.매출과 같은 연속형 데이터를 다룰 경우, 평균과 표준편차(variance)를 활용하는 방법으로 전환해야 합니다. 3. 연속형 데이터에 적합한 샘플사이즈 공식연속형 데이터에서는 다음 공식을 사용합니다:(사진) 여기서:Zα/2 : 유의 수준(예: 95% 신뢰 수준에서는 1.96)Zβ : 검정력(예: 80% 검정력에서는 0.84)Δ: 기대하는 평균 차이 (예: 매출 증가율에 따른 차이, 1.05 - 1.00 = 0.05)σ: 데이터의 표준편차 (예: 매출 데이터의 표준편차) 4. 샘플사이즈 계산 예시기본 가정:현재 평균 매출: 100예상 증가율: 5% (즉, 105)표준편차: 15 (매출 분산에서 도출)유의 수준: 95%검정력: 80% (사진)
- 0
- 1
- 42
Q&A
코드 공유 관련 부탁드립니다.
안녕하세요.많은 분들이 코드 공유를 요청하셔서,조금 정리하여서 올려드렸습니다.강의 목차 (섹션1. OT) 부분에 첨부해드렸습니다.감사합니다.
- 1
- 2
- 120
Q&A
A/B 테스트 period calculation
안녕하세요.제가 질문을 정확히 이해하였는지는 잘 모르겠습니다만, minimum sample size 수는 각 그룹별로 충족해주어야 하는 샘플 수이기 때문에, daily user 가 300인 상황에서 35.5일을 채워야하는게 맞습니다. 그리고 300을 2(그룹수)로 나눠서 a , b 그룹 동시에 daily로 150, 150채우면서 35.5일까지 실험을 진행하게 됩니다.
- 0
- 1
- 39
Q&A
결과정리, 해석해주시는 부분에서 질문
안녕하세요.질문 해주신 부분에 대한 답변 드립니다.Q. App상에서 Buy CVR 을 구할때 raw data는 어떻게 확보되는건가요?A. raw data의 경우 로그 데이터이기 때문에 방대한 양의 데이터를 저장관리를 통해 분석을 진행하게 됩니다. 클라우드 환경을 쓸 경우, 데이터 스트림 서비스를 통해서 로그 데이터를 저장소에 확보하게 되고, 만약 클라우드 서비스를 쓰지않는 경우, 직접 SDK 개발을 통해서 프론트엔드 개발 코드에 넣어서 로그 데이터 수집을 하게 됩니다.결론은 로그 데이터 수집을 위한 데이터 파이프라인 형성을 하셔야 합니다. Q. 정렬 필터 변경이 구매전환율(Buy CVR)에 미치는 영향을 측정하기 위해 사용하시는 특정 분석 도구가 있나요?A. 조금 애매한 질문이긴합니다만, 데이터 수집만 잘 된다면 어떤 분석 도구를 사용하던지 상관은 없습니다. 만약 이러한 AB Test에 특화된 분석 결과물 확인을 원하신다면 Third Party의 한 도구로써 "핵클"이라는 서비스 추천드려봅니다. 감사합니다.거친코딩 드림.
- 0
- 1
- 43
Q&A
섹션1의 마지막 강의(DataFrame에서 자주 사용하는 전처리 기법)의 오류 해결방법
안녕하세요.일단 먼저 데이터프레임의 경우,문자열이 있더라도 연산이 가능한컬럼(int, float형)만 감지해서 찾아서 연산하도록 설계되어있습니다.해당 에러의 원인을 저도 질문자님의 전체 코드를 확인한 것이 아니라, 정확한 원인은 찾기 어렵네요..감사합니다.
- 0
- 1
- 69
Q&A
여기서 유의수준은 p-value와 동일한가요?
안녕하세요.유의수준 뜻은 표본의 통계치가 귀무가설과 같이 나올확률입니다.5%는 통상적 수치로써 사용되는 값이며,반드시란 개념은 아닙니다.도메인에 맞게 1~10% 그 이상 그이하로 정할 수 있습니다.다시말해서, 내가 ab test 전, 정한 기준(유의수준)에 내가 가지고 있는 표본의 통계치가 높은지 낮은지에 따라서 통계적 의사결정을 내리는 것이 ab test 입니다 감사합니다.
- 0
- 1
- 120
Q&A
Pdf자료가 어딨죠
안녕하세요.거친코딩입니다.수업자료는 첫 pdf 구글드라이브 링크 걸어놨습니다.참고부탁드립니다.감사합니다.
- 0
- 1
- 102
Q&A
파일을 읽어들일 때 질문 있습니다
안녕하세요.거친코딩입니다.그렇게 하셔도 무방합니다만,기본 root 경로를 잡아놓고 다른 파일도 불러들여야할때 중복코드를 넣지않고자 그렇게 하였습니다.감사합니다.
- 0
- 1
- 153
Q&A
최소 샘플 사이즈 관련 문의드립니다.
안녕하세요.학습자님 질문에 대한 답변 드립니다.AB Test를 위한 최소 샘플사이즈 수를 계산하기 위해서는 portion(지표)인 경우에는 쉽게 구할 수 있습니다.다만, continuous(지표)에 대해서는 한 가지 문제 때문에 바로 구할수 없는데요.Standard Deviation입니다.보통 실험 설계전에 위 통계량을 구할 방법이 없기 때문에 임의의 값을 넣어서 샘플 사이즈 수를 구하거나,혹은 이전에 비슷한 실험이나 연구가 있었다면 해당 실험 또는 연구에서 얻은 데이터의 표준편차를 사용할 수 있습니다.감사합니다.
- 0
- 1
- 298