강의

멘토링

로드맵

Inflearn brand logo image
데이터 사이언스

/

데이터 분석

[데이터 전처리] 걱정하지마! Pandas가 있으니까.

데이터는 있는데 이걸 어떻게 파이썬에서 읽어 들이고 처리해야 할 지 막막하신가요? 걱정하지 마세요. Pandas의 마법으로 처리할 수 있습니다. Pandas는 가장 강력하고 효율적이며 유용한 데이터 처리 라이브러리입니다. Pandas로 데이터 전처리 Skill-UP! 인사이트 팍팍!

(5.0) 수강평 1개

수강생 13명

  • DataFactory
판다스
데이터분석
데이터분석실습
데이터처리
공공데이터
PythonPandas데이터 엔지니어링data-sciencedata-processing

먼저 경험한 수강생들의 후기

이런 걸 배울 수 있어요

  • 자신의 경력 전반에 걸쳐 활용할 수 있는 데이터 처리 기술

  • 데이터 분석을 위한 필수 요소로 널리 자리 잡은 Pandas!

  • 데이터병합, 재구조화, 결측치 처리, 중복데이터 처리

  • 텍스트 데이터, 범주 형데이터, 날짜 데이터 처리하기

  • 다운로드 가능한 교재(pdf)와 실습 파일을 제공

📢 이 강의의 장점

  • 단순히 Pandas의 기능만 알려드리는 것이 아닙니다. 데이터 전처리를 "왜" 해야 하는지, "언제" 해야 하는지, "어떻게" 해야 하는지, 그리고 "어떤 기준"으로 해야 하는지를 맥락을 통해 이해하고 스스로 판단할 수 있도록 설명합니다.

  • PC에 아무것도 설치할 필요 없이, 웹 브라우저만으로 구글 코랩에서 바로 코딩 실습을 할 수 있습니다.

  • PDF 교재 파일과 바로 사용할 수 있는 실습 코드를 제공합니다.

  • 실제 영화 IMDB 데이터셋으로 전처리 실전 감각을 키울 수 있습니다. 실제 데이터에서 발생할 수 있는 전처리 문제에 부딪히며 문제 해결 능력을 키울 수 있습니다.

📌 Pandas를 활용한 데이터 전처리(Preprocessing)

  • Pandas는 데이터 전처리에 특화된 강력하고 유연한 파이썬 라이브러리 입니다.

  • 데이터 전처리는 데이터 분석 또는 데이터 모델링 전에 원시 데이터(raw data)를 분석에 적합한 형태로 변환하는 필수적인 과정입니다.

  • 결측치, 이상치, 중복 데이터를 적절히 처리하여 데이터의 품질을 향상하고 분석 효율을 향상 할 수 있습니다.

  • 텍스트 데이터, 범주형 데이터, 시계열 데이터를 처리할 수 있습니다.

  • 더 자세한 내용을 강의에서 직접 확인해 보세요. 😄

📌 데이터 전처리? 이런 질문에 답해 드립니다!

  • 데이터를 파일로부터 불러올 때 어떻게 해야 하나요?

  • DataFrame에서 특정한 조건에 맞는 행이나 열을 어떻게 선택하나요? 원하는 기준으로 데이터를 필터링하거나 정렬하는 방법이 있나요?

  • 여러 개의 DataFrame을 합치거나 병합할 때, merge()와 concat()의 차이점과 각각 어떤 상황에서 사용하는 것이 적절한지 헷갈립니다. 명확하게 설명해 주실 수 있나요?

  • 결측치를 처리하는 효과적인 방법은 뭘까요? 어떤 경우 삭제하고 어떤 경우 대체하나요? 예를 들어, 특정 통계값으로 대체하는 기준을 어떻게 정해야 할까요?

  • 이상치를 탐지하는 시각적인 방법 외에, 통계적인 기준이나 함수를 활용하는 방법이 있을까요? 그리고 탐지된 이상치를 무조건 제거하는 것이 최선인가요?

  • 텍스트 데이터를 전처리할 때, "정규 표현식"이 중요하다는데 그게 뭔가요?

  • 범주형 데이터를 어떻게 구분하나요? One-Hot Encoding과 Label Encoding - 각 방법은 어떤 경우에 사용하는 것이 좋을까요?

  • 시계열 데이터를 다룰 때, 날짜/시간 형식 변환 외에 특별히 주의해야 할 전처리 사항이 있을까요? 예를 들어, 시간 간격 조정이나 이동 평균 계산 같은 것들이 전처리에 포함될 수 있나요?

누구나 쉽게 따라하며 이해할 수 있도록 친절하고 자세한 실습 과정을 제공합니다.

📌이런 분들을 위해 준비했습니다!


데이터 분석에 입문하려는 분

데이터 분석 업무에 도전하고 데이터 처리 역량을 강화하고 싶은 입문자


기초가 부족하다고 느끼는 분

데이터 분석을 시작하고 싶지만 어디서부터 시작해야 할지 막막한 분들


Pandas가 처음인 분

이미 데이터 분석을 공부한 적이 있지만 Pandas에 익숙하지 않아 활용에 어려움이 있는 분들

🏅 이 과정을 마치면 무엇을 할 수 있을까요?

  • Pandas의 기초를 마스터 할 수 있습니다.

  • Pandas를 활용하는데 익숙하지 않아 번번이 좌절했던 분들도 자신감 있게 Pandas를 활용할 수 있습니다.

  • 데이터 전처리 기술을 이해하고, 전처리 단계에서 수행되는 주요 작업과 기술을 숙지할 수 있습니다.

🤔 궁금한 점이 있나요?

Q. 파이썬을 잘 몰라도 강의 수강이 가능한가요?

파이썬의 기초 문법 정도는 이해하고 있어야 합니다.

Q. 데이터 전처리를 배워야 하는 이유는 뭘까요?

"데이터 분석 업무의 8할이 데이터 전처리" 라는 말이 있을 정도로 많은 시간을 데이터 전처리에 쏟게 됩니다. 실세계의 데이터(raw data)는 "값이 없거나, 이상한 값이 들어가 있거나, 포맷이 맞지 않거나..." 처럼 깔끔한 데이터(Clean data)가 하나도 없습니다. 정제되지 않는 데이터는 데이터 분석의 결과를 왜곡할 수 있습니다. 따라서 데이터 전처리는 데이터 분석의 필수 단계라고 할 수 있습니다.

🛍 수강 전 참고 사항

실습 환경

  • 사용 도구 : 구글 Colabatory를 사용합니다. 구글 계정과 웹 브라우저만 있으면 됩니다.


학습 자료

  • PDF 형태의 학습 교재를 제공합니다.

  • 실습 파일(.ipynb), 실습 데이터 등을 제공합니다.

선수 지식 및 유의사항

  • 데이터 분석 입문자를 위한 과정으로 기본적인 파이썬 문법은 숙지해야 합니다.

  • 모든 강의를 순서대로 학습할 필요는 없어요. Pandas에 어느 정도 익숙한 분이라면 필요한 부분만 선택해서 들어도 됩니다. Pandas가 초면이라면 처음부터 천천히 학습해 주세요.

Python, Pandas, data-science, data-analysis, data-cleaning

이런 분들께
추천드려요

학습 대상은
누구일까요?

  • Pandas를 사용한 데이터 전처리에 목마른 분들

  • 데이터 분석에 입문하시는 분들

선수 지식,
필요할까요?

  • 파이썬 기초

안녕하세요
입니다.

  • 전산학 학사, 통계학 석사

  • 삼성디스플레이, 삼성 전자, 한국 오라클 교육센터, 멀티 캠퍼스, 에티버스러닝 등 다수의 기업체 강의 경력

  • Oracle 공인 강사, Oracle Cloud Infrastructure(OCI) 공인 강사

  • Google Cloud Authorized Trainer(GCP) 공인 강사

  • 데이터 분석, 데이터 시각화, 머신러닝, 딥러닝, Cloud, RDBMS 등 강의

     

커리큘럼

전체

24개 ∙ (6시간 43분)

해당 강의에서 제공:

수업자료
강의 게시일: 
마지막 업데이트일: 

수강평

전체

1개

5.0

1개의 수강평

  • sprun7390님의 프로필 이미지
    sprun7390

    수강평 1

    평균 평점 5.0

    수정됨

    5

    29% 수강 후 작성

    Pythonのデータ前処理の学習に大変役立ちました。 続編の講義も用意されると嬉しいです。 基礎から丁寧に教えていただき、ありがとうございました。

    • aonekoda
      지식공유자

      良いレビューありがとうございます。

지식공유자의 깜짝할인 중

₩4,035

22%

₩44,000

비슷한 강의

같은 분야의 다른 강의를 만나보세요!