기계공학을 전공했지만 졸업 후엔 줄곧 코드를 읽고 쓰는 일을 했습니다. Google AI/Cloud GDE, Microsoft AI MVP입니다. 텐서 플로우 블로그(tensorflow.blog)를 운영하고 있고, 머신러닝과 딥러닝에 관한 책을 집필하고 번역하면서 소프트웨어와 과학의 경계를 흥미롭게 탐험하고 있습니다.
『혼자 만들면서 공부하는 딥러닝』(한빛미디어, 2025), 『혼자 공부하는 머신러닝+딥러닝(개정판)』(한빛미디어, 2025), 『혼자 공부하는 데이터 분석 with 파이썬』(한빛미디어, 2023), 『챗GPT로 대화하는 기술』(한빛미디어, 2023), 『Do it! 딥러닝 입문』(이지스퍼블리싱, 2019)을 집필했습니다.
『밑바닥부터 만들면서 배우는 LLM』(길벗, 2025), 『핸즈온 LLM』(한빛미디어, 2025), 『머신 러닝 Q & AI』(길벗, 2025), 『개발자를 위한 수학』(한빛미디어, 2024), 『실무로 통하는 ML 문제 해결 with 파이썬』(한빛미디어, 2024), 『머신러닝 교과서: 파이토치 편』(길벗, 2023), 『스티븐 울프럼의 챗GPT 강의』(한빛미디어, 2023), 『핸즈온 머신러닝 3판』(한빛미디어, 2023), 『만들면서 배우는 생성 딥러닝 2판』(한빛미디어, 2023), 『코딩 뇌를 깨우는 파이썬』(한빛미디어, 2023), 『트랜스포머를 활용한 자연어 처리』(한빛미디어, 2022), 『케라스 창시자에게 배우는 딥러닝 2판』(길벗, 2022), 『개발자를 위한 머신러닝&딥러닝』(한빛미디어, 2022), 『XGBoost와 사이킷런을 활용한 그레이디언트 부스팅』(한빛미디어, 2022), 『구글 브레인 팀에게 배우는 딥러닝 with TensorFlow.js』(길벗, 2022), 『(개정2판)파이썬 라이브러리를 활용한 머신러닝』(한빛미디어, 2022)을 포함하여 수십여 권의 책을 우리말로 옮겼습니다.
강의
클립
전체 1수강평
- <밑바닥부터 만들면서 배우는 LLM> 완독 챌린지
- <밑바닥부터 만들면서 배우는 LLM> 완독 챌린지
- <밑바닥부터 만들면서 배우는 LLM> 완독 챌린지
게시글
질문&답변
7장 3절 이후는 언제 올리나요?
안녕하세요. 7장 강의는 오늘부터 다음 주까지 업로드될 예정입니다. 감사합니다!
- 0
- 3
- 19
질문&답변
해설강의 쿠폰 가능할까요??
네 강의에 직접 추가해 드렸습니다.감사합니다.
- 0
- 3
- 26
질문&답변
해설강의 쿠폰 놓쳤는데, 재발급 가능할까요?
안녕하세요. 강의에 직접 추가해 드렸습니다. 감사합니다!
- 0
- 2
- 27
질문&답변
2.2 텍스트 토큰화 하기 강의 질문
안녕하세요. 두 번째 영상인 '2 강의 소개'입니다. 감사합니다!
- 0
- 1
- 21
질문&답변
<CH 4.1> "LLM구조 구현하기" 장 마지막의 Logits 차원에 대한 문의
안녕하세요. 박해선입니다. 제가 말한 입출력 차원이 같아야 하는 곳은 트랜스포머 디코더 블록과 그 안의 구성 요소입니다. 전체 모델의 출력은 50257이 맞습니다. 4장 강의를 끝까지 들으시면 이해가 되실 것 같습니다. 감사합니다!
- 0
- 1
- 25
질문&답변
CH3의 맨 처음에 등장하는 '임베딩 입력 시퀀스' 텐서 값은 임의의 숫자인가요?
안녕하세요. 박해선입니다. 트랜스포머를 포함해 모든 신경망 모델은 훈련 전에 랜덤하게 가중치를 초기화하고 훈련을 통해 목표에 최적인 값을 찾아갑니다. 본문에 나온 벡터는 문장에 나온 그대로 설명을 위해 '가정'한 것입니다. 즉 예를 들어 설명하기 위함입니다. 실제 숫자를 사용하지 않는다면 수학 식을 사용해서 설명해야 하는데 그게 더 이해하기 어렵거든요. 감사합니다!
- 0
- 1
- 18
질문&답변
Chapter1에서 말하는 "모델"이 정확히 어떤건가요?
안녕하세요. 모델이란 머신러닝 알고리즘을 구체화한 결과물이라고 생각할 수 있습니다. 하지만 추상적인 용어이기 때문에 문맥에 따라 조금씩 다르게 해석될 수 있어요. 신경망을 비롯해 대부분 머신러닝 알고리즘은 일종의 수학 함수를 찾는 과정이므로 모델을 하나의 거대한 수학 함수라고 생각할 수도 있습니다. 종종 모델을 훈련한다, 모델을 사용한다라고 말하기도 합니다. 이런 경우 모델은 프로그래밍 코드로 구현한 객체입니다. 예를 들어 Gemma 모델이란 구글에서 공개한 오픈소스 LLM 모델(추상적)을 지칭하거나 transformers 라이브러리에서 Gemma 모델의 가중치를 다운로드하여 생성한 파이썬 객체를 나타낼 수도 있습니다. 모델에 개념이 아직 확실치 않다면 머신러닝 입문서를 먼저 보면 좋을 것 같습니다. 감사합니다!
- 0
- 2
- 20
질문&답변
챌린지 쿠폰 재 발급 가능 여부 확인 드립니다.
안녕하세요. 박해선입니다.이 쿠폰은 일회성으로 발급한 것으로 다시 발급하기 어려운 점 이해 부탁드립니다.감사합니다.
- 0
- 3
- 24
질문&답변
gpt_download 관련 오류 질의입니다.
안녕하세요. 박해선입니다.이 책의 예제는 코랩을 기반으로 테스트되어 있어 가능하면 코랩을 사용하실 것을 권장합니다. 로컬에서 작업하시는 경우 환경과 오류에 대한 통제 권한은 독자에게 있습니다. 제가 원격에서 오류 메시지만 보고 원인을 알아 내기 어려운 점 이해 부탁드립니다. 다만 혹시 작업 디렉토리의 전체 경로에 한글(사용자 이름 등)이 사용되어 있다면 이를 제외해 보시는 것을 추천해 드립니다.감사합니다!
- 0
- 2
- 44
질문&답변
그림 4-5의 분산 값 문의드립니다.
안녕하세요. 앗, 그렇네요. 원서 에러타인데 미처 제가 거르지 못했습니다. 소수점 이하 자릿수를 맞추도록 그림 4-5에서 분산 0.39를 0.02로 바꾸어 주세요. 감사합니다!
- 1
- 1
- 30




