9년차 데이터 과학자, 데이터 엔지니어, 머신러닝 엔지니어로 근무했으며, 쏘카와 타다에서 데이터 분석, 데이터 엔지니어링 개발, 머신러닝 알고리즘을 개발했습니다.
카일스쿨 유튜브에 데이터 커리어 관련 영상을 올리고 있으며, 어떻게 해야 강의를 수강하신 분들이 회사에서 일을 잘할 수 있을까?를 고민하며 자료를 만들고 있어요.
Google의 GDE(Cloud)로 활동하고 있어요.
카일스쿨 유튜브 : https://www.youtube.com/c/kyleschool
기술 블로그 : https://zzsza.github.io/
인스타그램 : https://www.instagram.com/data.scientist/
대표 컨텐츠 : https://github.com/Team-Neighborhood/I-want-to-study-Data-Science
데이터 과학자가 되기 위해 진행한 다양한 노력들 : https://zzsza.github.io/diary/2019/04/05/how-to-study-datascience/
Courses
Reviews
- From 3 Million Blog Pageviews: 'Pragmatic Tech Blog Writing'
- [Reading Challenge] Let's Read 『AI Engineering』 Together in 5 Weeks!
- [Reading Challenge] Let's Read 『AI Engineering』 Together in 5 Weeks!
- [Reading Challenge] Let's Read 『AI Engineering』 Together in 5 Weeks!
- [Reading Challenge] Let's Read 『AI Engineering』 Together in 5 Weeks!
Posts
Q&A
섹션 별 퀴즈
안녕하세요!발표 자료에 있는 문제입니다. 인프런 플랫폼에서 나오는 객관식 문제 말구요
- 0
- 1
- 23
Q&A
진도율 업데이트
안녕하세요! 강의를 온라인에서 클릭할 경우 하단에 봤어요 버튼이 있는데 이걸 눌러주시면 되어요! (사진)
- 0
- 2
- 44
Q&A
진도율 업데이트
안녕하세요! 웹에서 봤어요 버튼이 있었던 기억이 나는데 모바일에선 안보이네요. 제가 지금 밖이라 집에 가서 확인해볼게요!진도율보다 미션 수행 여부로 미션을 확인하니 미션 수행만 하셨으면 걱정하지 않으셔도 괜찮아요.이따 밤에 추가적으로 확인해볼게요🙏
- 0
- 2
- 44
Q&A
데이터 취합과 정리 어디서부터 해야할까요
종우님 안녕하세요!회사마다 상황이 다양해서 회사의 상황에 따라 다양한 과정이 있을 것 같은데, 일반적으로 시도할 아이디어를 말씀드리면강의 초반이 1일차 PM의 이야기에 나오는 질문들에 대해 답을 해보시고각 팀별로 데이터를 어떻게 활용하고 있는지, 자주 사용하는 쿼리나 지표가 있는지비즈니스 모델은 어떻게 되는지, 그 비즈니스 모델에서 사용되는 용어가 무엇이 있는지개발의 용어, 디자인의 용어, 사업팀의 용어가 다른지위 내용을 정리해보고, 사람들이 통일된 용어를 사용하도록 업무 프로세스를 변경하고 전사에 전파하는 과정이 필요할 것 같아요그 과정에서 각 팀에서 데이터를 추가해서 볼 때, 알아서 할 것인지 중앙집권적으로 할 것인지 결정해야 합니다. 중앙집권적이라고 하면 속도가 느려질 수 있지만 통일감을 갖출 수 있고 알아서 하게 하면 규칙이 풀어질 가능성이 있지요. 그래서 초반엔 중앙집권적으로 하다가 점진적으로 사람들의 데이터 활용 역량이 올라가면 인프라 레벨에서 할 수 있도록 구현할 수 있어요(인프라 레벨이라고 하면 어떤 지표를 보고 싶을 때 정의를 해두면, 그 지표를 전사적으로 쓸 수 있게 하는 메트릭 스토어 같은 지표 플랫폼 등입니다)데이터 정보를 모으고 -> 사람들이 데이터를 활용하게 해야 하는데 그 과정에서 교육이나 같이 데이터 관련 일을 해보거나 사람들의 상황(데이터 리터러시에 대해 높은지 낮은지 등)에 따라 방법이 달라집니다데이터 문화 파트 영상을 보셨던데, 그 기준들에 맞게 우리 회사에서 지금 필요한 것이 무엇인지 고민해보고 하는 과정이 필요할 것 같네요질문해주신 부분은 종우님 회사 상황을 자세히 알아야 여러 관점으로 볼 수 있어서, 강의를 더 들으시고 코칭을 요청해서 이야기를 나눠보는 것도 방법일 것 같아요!
- 0
- 2
- 30
Q&A
데이터 로그 설계 과제 작성
현리님 안녕하세요! 로그 설계랑 지표 정의까지 다 잘 정리하셨네요!! 고생하셨습니다 피그마 기획서를 보고 피그마 기준 page를 사용하셔도 괜찮습니다. 회사의 상황에 따라 적절하게 수정하면 됩니다. 다만 스프레드시트를 보니까 page에 여러 이벤트가 있는 경우가 있는데(예를 들어 search_result) 이럴 때 셀병합을 해주시면 시각적으로 더 인지하기 좋습니다(search_result 페이지에 view_search_result, click_food, click_filter 이벤트가 있구나! 라고 이해가 됩니다. 지금은 옆은 빈칸이라 추론을 해서 search_result인가보다 하게 되지요)[1] 기능이 잘 동작하는지 확인하기에서 추천된 음식, 동네 맛집쪽은 view 이벤트 또는 노출(Impression) 이벤트를 사용할 수 있습니다. 위에서 정의할 때 click_recommend_food/view_home로 잘 하셨는데, 밑에서 추천된 음식을 구분하는 방법을 잘 모르겠습니다 ㅠㅠ라고 말씀하신 것은 어떤 의미일까요? click_recommend_food에 food_id가 있을테니 활용할 수 있지요 나머지 부분은 잘 하셨습니다! 지표 정의 문제에서처럼 왜 이 지표인가?를 같이 기록해보시면 좋을 것 같아요!(지표 정의 + 로그 설계까지 앞으로는 같이!)
- 0
- 2
- 39
Q&A
3장 강의자료 다운로드 시, 2강이 다운로드 됩니다.
안녕하세요!앗 제가 방금 다운로드할 때는 파일이 맞게 다운로드가 되고 있는데, 어떻게 다운로드가 되고 있나요?18. 3-1. Intro와 카일스토리에서 다운로드를 하셨는데 데이터 리터러시 파일이 다운로드가 되고 있는 상황일까요?브라우저를 변경해도 동일하게 발생하나요? 새벽에 인프런에서 점검 작업을 한거로 알고 있는데, 그 여파로 오류가 발생하는 것일수도 있겠어요
- 0
- 2
- 31
Q&A
데이터 로그 설계 과제 작성
현리님 안녕하세요! 제가 지금 몸이 안좋아서 늦어지고 있어요. 2-3일 내로 피드백 드릴게요..!답변이 늦어져서 죄송합니다 🙏
- 0
- 2
- 39
Q&A
챌린지 검색이 안되서요.
안녕하세요. 어떤 리스트에서 보이지 않는다는걸까요?챌린지는 일반 강의와 다르게 시작일 기점으로 세부 내용을 확인할 수 있다고 해요!현재 확인해보니 Public하게 공유된 "챌린지 참여 방법 정리(꼭 읽어주세요!)"은 보신 것으로 나오네요(이 내용은 Public 공유라서 미리 볼 수 있어요) (사진)내 학습 - 챌린지쪽을 보면 저는 이렇게 나오네요(챌린지를 클릭하신 것이 맞을까요? 온라인이 활성화되어 있으면 챌린지는 보이지 않아요)
- 0
- 1
- 79
Q&A
코칭 관련
홍주님 안녕하세요! 네 여전히 가능합니다!급하게 마감되진 않을 것 같아서 강의 듣고 신청해주셔요!!
- 0
- 2
- 38
Q&A
array 등
안녕하세요!배열 함수를 자주 접하신 적이 없으면 생소할 수 있습니다. 우선 BigQuery의 Array 데이터는 Google Analytics4나 Firebase를 사용하는 회사에서는 자주 볼 수 있습니다. GA4나 Firebase를 배열로 데이터를 저장하기 때문에 이걸 사용하지 않으면 데이터를 풀 수 없습니다. 그럼 BigQuery만의 특수한 문법이 아닌가?라고 생각할 수 있는데, 전통적인 OLTP에서는 배열 데이터가 없기도 합니다. 예를 들어 MySQL에서는 배열 함수가 없고, JSON 형태를 활용해서 만들어야 합니다. 예시는 링크에서 확인할 수 있습니다. 그 외에 PostgreSQL에는 배열이 있습니다. BigQuery에서 사용하는 ARRAY 관련 함수를 볼 수 있습니다.공식 문서 : https://www.postgresql.org/docs/current/arrays.html 데이터 웨어하우스(DW) 계열에서는 배열 데이터가 많이 활용됩니다. 여러 데이터를 저장해야 할 때, 배열 형태로 데이터를 저장하곤 합니다(파이썬의 List처럼) 그리고 그걸 활용할 때 배열을 사용하게 됩니다. Snowflake 문서 : https://docs.snowflake.com/ko/sql-reference/functions/array_aggSpark 문서 : https://spark.apache.org/docs/latest/api/python/reference/pyspark.sql/api/pyspark.sql.functions.array.html 데이터 저장하는 형태가 복잡해지면 배열은 한번 쯤은 경험하게 되는 것 같아요. 사용자 앱 로그 데이터를 저장할 때는 배열 형태로 저장하는 것이 수월한 경우도 꽤 있었어요. 파이썬에서도 Dict, List가 존재하는데 데이터를 어떻게 저장해야 하느냐에 따라 적절하게 활용하곤 합니다. 데이터베이스, 데이터 웨어하우스에도 목적에 따라 적절하게 배열이나 파이썬의 딕셔너리처럼 저장하고 싶을 때 강의의 ARRAY, STRUCT를 사용한다고 생각하시면 될 것 같아요.
- 0
- 2
- 32





