블로그

윤선미

인프런 수강생은 이런 데이터가 궁금해요!

안녕하세요. 커뮤니티 데이터리안의 윤선미입니다.  오늘도 애정을 가지고 인프런에 대해서 얘기를 해보려고 합니다. 세계관 여기에는 다 인프런과 친하신 분들이니까 굳이 설명할 필요는 없지만, 용어를 정리하는 의미에서 간단하게 인프런의 세계관에 대해서 얘기해볼게요. 이곳에는 두 종류의 사람이 있습니다. 강의를 만들어 업로드 하는 사람: 지식공유자 강의를 수강하는 사람: 현재는 학생 또는 수강생이라고 부릅니다. 데이터리안은 강의를 제작하면서, 종종 다른 지식공유자분들의 강의를 수강하기도 하니까 분류하자면 둘 다에 속합니다. 지식 공유자 입장에서 지식공유자 활동을 하면서 인프런이 제공해주고 있는 데이터 이외에 다른 데이터들을 알고싶다는 생각을 꾸준히 해왔는데요. 예를 들면 이런겁니다. 우리 강의에 어떤 경로로 유입되었을까? 강의를 완강하지 않았다면 이탈 지점은 어디일까? 기초 SQL 강의를 들은 수강생이 중급 SQL 강의도 결제했을까? 글로 정리된 내용은 <인프런 지식 공유자는 이런 데이터가 궁금해요!>에 있습니다. 지식공유자 입장의 데이터가 더 궁금하신 분들은 위에 링크를 클릭해주세요. 수강생의 입장에서 오늘은 수강생의 입장에서 제공받고 있는 여러 데이터들에 대해서 얘기를 해보려고 합니다. 인프런에 수강생이 볼 수 있는 다양한 화면이 있지만, 수강생 학습 대시보드와 강의 소개 페이지를 중심으로 얘기를 해보겠습니다. 아이디에이션은 @S, @북북, @민주, @leebom, 그리고 @선미 가 함께했습니다. ... 더 읽어보기: https://velog.io/@datarian/inflearn-student

데이터 분석인프런데이터분석데이터리안

맷수달

한국 데이터 산업계에서 IML이 덜 언급되는 이유와 그 함의

미국에서는 널리 회자되지만, 한국 데이터 산업계에서는 이상할 만큼 언급 빈도가 낮은 책이 있다. Christoph Molnar의 'Interpretable Machine Learning'(이하 IML)이다. 굳이 "산업계"라고 한 이유는, 학계에서는 비교적 널리 읽히는 것으로 보이기 때문이다.흔히 드는 설명은 이렇다. 책 속 수식과 개념의 밀도가 데이터 분석가에게는 다소 높게 느껴진다는 것. 그러나 IML이 요구하는 수학은 대체로 이공계 학부 1–3학년 수준의 선형대수·확률·기초 최적화이며, 체계적으로 접근하면 충분히 소화 가능하다. 그렇다면 "모든 분석가가 이공계 출신은 아닌데, 여전히 장벽이 높지 않은가?"라는 반론이 따라온다. 핵심은 분명하다. 공짜 점심은 없다.여기서 말하는 ‘공짜 점심’은 학습 비용 없이 실무 역량을 얻을 수 없다는 상식적 주장이지, 최적화 이론의 No Free Lunch 정리 그 자체를 말하는 것은 아니다.한국 산업계에서 IML이 덜 언급되는 배경에는 여러 요인이 겹쳐 있다.1.도구 의존성: 라이브러리가 기본 제공하는 SHAP/Feature Importance 등을 코드 몇 줄로 호출하면 결과는 손쉽게 얻는다. 그러나 그 과정에서 가정(독립성·배경 데이터 선택), 한계(불안정성·상관 편향), 반례(비현실적 조합·오프매니폴드 설명)를 판단하는 역량이 뒤로 밀린다.예: PD(Partial Dependence)는 피처 상관이 클 때 존재하지 않는 조합을 평균할 수 있고, ALE가 이를 완화한다. LIME은 지역 근사 특성상 샘플링·시드에 민감하며, SHAP은 배경 분포 선택과 피처 상관 구조에 따라 귀속값이 크게 달라질 수 있다.    2.교육 경로의 공백: 비이공계 전공자가 분석가가 되는 경로는 많지만, 그 사이 수학적 기초를 보강하는 체계는 상대적으로 약하다. “모형을 돌리는 법”은 빠르게 배우지만, “왜 그런 결과가 나왔는지”를 규명하는 해석·검증의 언어가 부족해진다.    3.직무 정의와 우선순위의 차이: 미국은 채용 단계에서부터 통계·ML·수학적 문해력을 전제하는 포지션이 많다. 반면 한국은 리포팅·BI 중심 분석의 비중이 높은 팀도 적지 않아, IML의 필요성이 조직 구조상 낮게 관찰될 수 있다. 반대로 금융·의료·공공처럼 규제와 책임이 강한 도메인에선 IML의 실익이 크다. 4.제품화 압력: 빠른 배포·AB 테스트·지표 운영이 1차 목표인 팀에서는, 사후 설명기법의 신뢰성·재현성 검증에 시간 투입이 어렵다. 그 결과 "설명"이 전달물로만 소비되고, 품질 보증 도구로 기능하지 못한다.이 지점에서 개념을 분리해 두면 좋다.해석가능성(interpretability): 모델이 구조적으로 사람이 이해 가능한가(선형 모형, GAM, 단조 제약 모델, 규칙 기반 등).설명가능성(explainability): 사후(post‑hoc) 기법으로 블랙박스의 의사결정을 해석 가능한 형태로 근사·요약하는가(LIME, SHAP, PD/ICE, ALE, counterfactual(반사실) 등).IML이 요구하는 수학은 실제로 다음과 대응된다.LIME: 지역(linear) 근사, 가중 최소제곱 → 선형대수학·회귀분석 기초.SHAP: 협력게임 이론의 공정 분배, 조건부 기댓값 → 확률론·조합론 기초.PD/ICE/ALE: 기댓값·적분, 상호작용 해석 → 확률론·미적분학 기초.Counterfactual: 제약하 최적화, 거리 측도, 실현가능성 → 최적화 기초.개인적 경험으로도, 현업 분석 경험이 전무했을 때조차 IML을 정독한 덕에 해석과 검증의 공용어로 소통할 수 있었고, 팀의 분석과 결정을 한 단계 전진시키는 데 기여할 수 있었다.한국 시장 역시 해석가능성·설명가능성의 기본 소양을 전제하는 방향으로 수렴할 가능성이 크다. 선택은 각자의 몫이다. 다만 그 선택이 학습 비용을 뒤로 미루는 선택이라면, 결국 품질·신뢰·책임의 요구 앞에서 더 큰 비용으로 돌아온다. 그런 의미에서 IML은 비용 대비 효율이 뛰어난 입문서이자 실무서다.마지막으로, 공학용 계산기가 미적분을 해결해준 지는 오래고, 요즘은 LLM도 상당량의 수식을 다룬다. 그러나 결과를 선택·검증·해석하는 사람은 결국 개념을 이해한 사람이다. 도구는 계산을 대신할 수 있어도, 판단은 대체되지 않는다.결론IML을 미루게 만드는 장벽은 "수식의 양"이 아니라 "가정·한계·반례를 판별하는 개념적 근육"의 부재다. 그 근육을 키우는 비용은 피할 수 없고, IML은 그 비용을 가장 싸게 치르는 길 중 하나다.

데이터 분석데이터과학데이터분석해석가능성설명가능성수학산업계이공계비전공맷수달송주은

데이터 분석 제대로 하기위한 3가지 기준

대통령 선거가 얼마 남지 않았습니다.올바른 선택과 대한민국을 위하고 경제, 청년실업을 생각할때 정말 옳은 현명한 선택을 하시기 바랍니다.저를 비롯한 고귀한 투표행사를 위한 한표를 위하여 올바른 선택/판단 에 대한 글입니다. 정확한 판단을 하기위한 기준데이터 분석과정에서 가장 중요한 문제  1. 무의식적 편향(confirmation bias)/확증편향 에서 자유로울 수 있을까? 2. “오차범위”와 “기준 조건”이 함께 제시되었는가? 3. “한국어는 주관적이고 맥락 의존적이기 때문에, 100% 정확한 전달은 불가능하다. 따라서 최대한 객관화, 수치화, 맥락 보완을 통해 100%에 가까워지려는 노력이 필요하다.”※ 무의식적 편향(confirmation bias)/확증편향  : 사람이 자신의 기존 신념, 기대, 가설을 확인해주는 정보만을 선택적으로 수용하고, 그에 반하는 정보는 무시하거나 축소해서 해석하는 경향을 말합니다. 이는 우리가 의사결정을 내릴 때 객관적인 판단을 방해하고, 잘못된 결론이나 왜곡된 신념을 유지하게 만들 수 있습니다. 1. 개념 정리 정의기존 믿음이나 생각을 뒷받침하는 정보에만 주목하고, 반대되는 정보는 무시하거나 과소평가하는 심리적 경향형태뉴스, 연구, 토론, 실험 등에서 자신이 믿는 것과 일치하는 정보만 선택원인인지적 편안함을 추구하려는 심리, 기존 신념을 유지하려는 자기 일관성 욕구결과오판, 고정관념 유지, 편향된 결론 도출, 집단극화2. 예시 정치적 의견: 진보 성향의 사람은 진보 매체 뉴스만 보고, 보수 뉴스는 '가짜 뉴스'로 무시함.건강 정보: 어떤 식이요법이 좋다고 믿는 사람이, 그것이 해롭다는 연구는 무시하고 유리한 기사만 찾아봄.채용 과정: 면접관이 특정 학교 출신을 선호한다면, 그 출신 지원자의 장점만 보고 단점은 무시할 수 있음.3. 왜 문제가 되는가?객관적인 판단을 저해하여 의사결정의 질이 낮아짐집단 내 토론이 극단화(Polarization)되는 현상 발생학문/과학 연구에서 실험 결과 왜곡 가능성 증가 (연구자가 원하는 결과를 유도)※ 극단화(Polarization) 란 :사람들이 어떤 주제나 이슈에 대해 토론하거나 정보를 주고받는 과정에서, 의견이 더 극단적인 방향으로 치우치는 현상을 말합니다. 이는 개인이 속한 집단의 공통된 신념이나 감정이 강화되면서, 점점 더 한쪽 방향으로 편향되는 심리·사회적 현상입니다.1. 개념 정리 정의어떤 이슈나 주제에 대해 의견이 토론이나 상호작용을 통해 점점 극단적인 방향으로 치우치는 현상원인동질적 집단 내 상호작용, 확증 편향, 사회적 동일시 욕구형태정치적 극단화, 사회적 갈등 격화, 집단 내 배타성 증가결과타인에 대한 이해 부족, 갈등 격화, 사회적 분열2. 작동 방식 확증 편향 작용→ 자신과 같은 생각만 접하게 되면 신념이 더욱 강화됨.사회적 비교→ “남들보다 더 열성적으로 보여야 한다”는 압박으로 극단적인 태도 취함.반대 집단에 대한 경계심→ 타 집단은 '틀렸다'고 확신하며, 이질감과 적대감을 강화.온라인 필터 버블→ SNS나 유튜브 알고리즘이 비슷한 견해의 정보만 보여주어 극단화 가속.3. 예시 – 실생활 중심 정리정치 토론같은 정치 성향의 사람들이 모이면 점점 더 강경한 주장만 나오게 됨소비자 리뷰부정적 댓글이 많은 곳에선 더 악의적인 댓글이 추가됨지역사회 갈등동일한 의견을 가진 주민 모임이 강경한 행동으로 이어짐4. 왜 문제가 되는가?사회의 중도·합리적 목소리 소멸갈등 해결보다 감정적 충돌 증가공공 정책 수립 시 의견 수렴 어려움다양성·포용성 위축5. 해결 방법 – 극단화 방지 전략이질적 집단과의 교류 유도→ 다양한 의견을 접할 수 있는 환경 조성의도적인 반대 의견 노출→ 알고리즘을 벗어난 정보 소비 노력토론의 룰 정하기→ 감정보다 사실 기반으로 논의하게 유도공감 훈련 및 경청 문화 조성→ 타인의 입장을 이해하려는 연습4. 어떻게 줄일 수 있을까?반대 의견 적극 수용: 반론도 충분히 검토해보기악마의 변호인 역할: 일부러 반대 관점을 주장해보며 사고 확장다양한 출처 활용: 정보 출처를 다양화해 편향 방지데이터 기반 의사결정: 감정보다 수치와 증거에 기반 아무리 과학적 리서치라도 그 결과가 ‘절대적 진실’은 아님. 다음을 늘 고려해야 한다.“누가 자금을 댔는가?”“누가 연구를 설계했는가?”“결론이 누구에게 유리한가?”“그 결론은 어떤 배경/가치를 전제로 하고 있는가?”이게 바로 Evidence-Based Thinking의 핵심 원칙※ Evidence-Based Thinking (근거 기반 사고) : 관, 감정, 관습이 아닌 객관적이고 검증된 증거에 기반하여 판단하고 결정을 내리는 사고 방식입니다. 이는 의학, 경영, 교육, 정책 결정, 채용 등 다양한 분야에서 활용되며, 비판적 사고의 실천 방식으로도 간주됩니다.1. 핵심 원칙 1.최고의 이용 가능한 증거 사용과학적 연구, 실험, 데이터 등 신뢰도 높은 자료를 기반으로 판단2.문제와 맥락에 대한 명확한 정의결정의 대상이 되는 문제, 환경, 조건을 분명히 규정3.비판적 사고의 적용모든 주장과 자료에 대해 검토, 의심, 논리적 평가 수행4.이해관계자의 가치와 선호 고려증거뿐 아니라 관련자의 입장과 상황도 함께 반영5.의사결정의 투명성과 재현 가능성 확보왜 그 결정을 내렸는지, 어떤 과정을 거쳤는지 설명 가능해야 함2. 비교 정리 – 전통적 사고 vs. 근거 기반 사고기준경험, 직관, 권위자 조언검증된 연구, 통계, 데이터과정즉흥적, 감각 중심체계적, 검토 중심결과편향 가능성 높음객관성, 신뢰성 향상적용 예시“이건 원래 이렇게 해왔어”“무슨 근거로 그렇게 하는가?”3. 주요 적용 분야Evidence-Based Medicine – 임상 시험 결과에 따라 치료 선택Evidence-Based Management – 조직 관리에 논문과 데이터 기반 접근Evidence-Based Policy – 공공정책 입안 시 실증연구 반영Evidence-Based Hiring – 이력서나 학력보다 실제 성과 기반 평가4. 실천을 위한 질문 프레임워크 (6A 질문법)Ask정확히 무엇이 궁금한가? 문제 정의Acquire관련된 정보를 어디서 얻을 것인가?Appraise그 정보는 얼마나 신뢰할 수 있는가? (출처, 방법 등)Aggregate다양한 정보를 어떻게 통합할 것인가?Apply어떻게 실천에 적용할 것인가?Assess실행 후 결과는 어떤가? 평가 및 피드백5. 실천 시 유의할 점모든 증거가 좋은 증거는 아님 → 메타분석, 무작위대조실험(RCT) 등 높은 수준의 근거 우선정보 편향 주의 → 확증 편향, 생존자 편향, 선택적 인지 회피맥락 반영 → 조직, 환경, 개인 차이에 따라 증거 해석은 달라질 수 있음 “리서치라도 수익, 이익, 취향이 개입되어 있다면 최적의 결론은 아니다.”모든 분석 결과는 “오차범위”와 “기준 조건”이 함께 제시되어야 한다.이유: 수치는 그 자체로 진실이 아니라, 그 수치를 만들어낸 조건과 오차범위가 진실의 윤곽을 결정하기 때문. 결론 : 모든 올바른 선택과 데이터분석과정과 결론에서 기역해야될것 은첫째 : 무의식적 편향(confirmation bias)에서 자유로운가?둘째 : “오차범위”와 “기준 조건”이 함께 제시되었는가?

데이터 분석판단기준확증편향무의식적편향기준조건근거기반사고극단화

Kenzie8

AI 시대 '서비스 기획자'는 어떤 형태로 진화할까?

 이제 우리가 이용하는 많은 서비스들에 크던 작던 AI기술들이 적용되고, 업무 현장에서도 챗GPT와 같은 AI도구들이 심심치 않게 활용되고 있습니다. 분명 지금 우리가 살고 있는 시대는 2~3년 전과 확연히 달라졌고, 앞으로 2~3년 뒤에는 지금까지의 변화와는 비교도 안되게 많은 변화들을 체감하게 될 것이라고 많은 전문가들이 입을 모아 얘기합니다. 앞으로 AI가 좀 더 우리 삶 깊숙히 개입하게 되면 서비스를 기획하는 서비스 기획자라는 직업의 성격도 바뀌게 될 것이고 그에 걸맞게 요구되는 능력도 조금 달라지지 않을까요? 그래서 한 번 제 나름의 생각을 정리해 보았습니다.AI 시대의 서비스 기획자는 단순히 서비스의 외형만 설계하는 것이 아니라, AI와 데이터를 기반으로 사용자 경험을 보다 정교하게 설계하는 역할을 하게 될 것으로 예상합니다. 항목별로 서비스 기획자에게 요구될 역량을 살펴보시죠!1. AI 이해 및 활용 능력서비스 기획자는 AI 기술의 기본 원리와 이를 서비스에 어떻게 적용할 수 있을지에 대한 깊은 이해가 필요합니다. AI가 고객 데이터를 어떻게 처리하고, 사용자의 행동 패턴을 분석하며, 개인화된 경험을 제공하는지에 대해 숙지해야 합니다. AI 모델을 직접 설계하지 않더라도 이를 적절히 활용할 수 있는 전략을 세우는 능력이 중요해집니다.2. 데이터 분석 및 해석 능력AI는 방대한 데이터를 처리하고 분석하는 데 강점을 가지고 있습니다. 서비스 기획자는 AI가 처리한 데이터를 바탕으로 사용자 요구와 행동을 파악하고, 이를 토대로 더 나은 서비스 경험을 설계할 수 있어야 합니다. 데이터를 읽고 해석하여 적절한 인사이트를 도출하는 능력은 필수입니다.3. UX와 AI를 결합하여 사용자 경험을 설계하는 능력사용자 경험(UX) 설계는 AI가 발전함에 따라 더욱 개인화되고 예측 가능한 형태로 변화할 것입니다. 기획자는 AI가 제공하는 데이터와 기술을 바탕으로 사용자의 요구를 미리 예측하고, 사용자와 상호작용하는 방식을 최적화해야 합니다. 예를 들어 챗봇이나 추천 시스템을 통해 사용자의 흐름을 매끄럽게 유도하는 등, AI와 UX를 결합한 새로운 사용자 경험을 설계하는 능력이 중요해집니다.4. 창의적 문제 해결 능력AI가 많은 작업을 자동화하고 효율화할 수 있지만, 인간 기획자는 창의적인 문제 해결과 혁신적인 아이디어 창출에 여전히 중요한 역할을 합니다. AI의 한계를 보완하고 새로운 서비스를 구상하며, 사람들의 실제 니즈와 감정적인 요구를 이해하고 이를 해결할 수 있는 서비스를 기획하는 것이 필요합니다.5. 협업 및 커뮤니케이션 능력AI 개발자, 데이터 과학자, 디자이너 등 다양한 전문가들과 협업하는 능력은 필수적입니다. AI와 데이터를 효과적으로 활용하려면 기술 팀과의 원활한 소통이 중요하며, 기술적 이해와 비즈니스적 목표를 연결할 수 있는 역량이 요구됩니다.6. 지속적인 학습AI와 관련된 기술은 빠르게 발전하고 있기 때문에, 서비스 기획자는 끊임없이 새로운 기술 동향을 학습하고 이를 서비스 기획에 적용할 수 있는 능력을 갖추어야 합니다. 머신러닝, 데이터 사이언스, 사용자 행동 분석 등의 분야에서 최신 트렌드를 따라가는 것이 필수입니다.결론위의 내용을 딱 한 문장으로 요약해서 AI시대 서비스 기획자를 정의하자면 "기술적 이해를 바탕으로 창의적이고 전략적인 사고를 통해 AI가 가진 잠재력을 최대한 활용하여 새로운 사용자 경험을 설계하는 사람." 정도이지 않을까요? AI 시대를 준비하려는 여러분들을 위해 서비스 기획자에게 요구되는 역량중에 하나이고, 갈수록 점점 더 그 중요성을 더해가고 있는 데이터 분석과 해석 능력을 키울 수 있는 콘텐츠를 준비하였습니다. 제가 심혈을 기울여 만든 저의 콘텐츠를 활용해서 AI시대가 찾는 서비스 기획자가 되어보는 건 어떨까요?인프런 강의 주소: https://inf.run/2RbLo[ESTsoft] WASSUP EST AI서비스 기획자 양성과정 5기 모집 (※마감 임박!): https://estfamily.career.greetinghr.com/o/121077  ※ 틈틈이 남는 시간을 활용해서 공부 하셔야 하는 분들은 인프런 강의를,하루 8시간 이상 수업에 할애하실 수 있는 분들은 WASSUP 과정을 추천 드립니다. 참고로 두 개 모두 100% 온라인으로 진행됩니다.  

데이터 분석AI인공지능데이터서비스기획UX프로덕트Product기획POPM

데이터분석가로성장하기 4

4. 지표를 사용한 데이터 분석의 장점과 단점은 무엇일까요?지표를 통해 얼마나 기업이 성장하고 있는지, 또 어떻게 성장해야하는지를 알수 있다고 했습니다. 지표는 현재 기업이 어떤 방향으로 나아가고 있는지를 나침판처럼 알려줍니다.우리는 DAU, MAU, WAU 를 통해 고객이 얼마나 방문했는지, 그 방문이 어떤 패턴을 그리는지, 그리고 앞으로 어떻게 될지도 예측할수 있습니다. LTV를 통해 기업이 평균적으로 내는 매출과 비용을 계산할수 도 있죠. 그리고 매출과 비용을 줄이는 방법도 찾아내는 데 도움이 됩니다.또 지표는 비교의 기준으로 사용됩니다.지표는 가장 행동에 잘 반응하는 고객들을 비교를 통해 찾아 낼 수 있습니다.이렇게 많은 장점을 가지고 있는 지표는 큰 단점 또한 가지고 있는데요. 단지 지표에만 집중하는 분석은 잘못된 결과를 불러오기도 합니다. 이전 시간에서 롤(LOL)의 KDA를 지표의 예시로 들었는데요. 만약 KDA를 게임 실력의 절대적인 기준으로만 여긴다면, 이 질문을 드리고 싶네요.플레이는 형편없는 데도 단지 운이 좋아 KILL을 많이 한 뒤, 킬수를 들먹이며 팀원들을 무시하는 유저는 좋은 실력의 유저일까요?다음 시간에는 데이터 분석가의 두번째 스킬인데이터 프로그래밍에 대해 이야기해보겠습니다.기대해주세요.#데이터리차드 #데이터분석

데이터 분석데이터리차드

채널톡 아이콘