무료
다른 수강생들이 자주 물어보는 질문이 궁금하신가요?
- 미해결혼자 공부하는 머신러닝+딥러닝
군집화 전 시각화
말 그대로 과일 이미지 데이터를 KMeans로 군집화 하기 전에 데이터가 어떤 식으로 분포되어 있는지 산점도를 보고 싶은데, 이때 코드는 어떻게 구현해야 할까요?
- 미해결혼자 공부하는 머신러닝+딥러닝
KMeans
307p에서... draw_fruits() 함수 생성할 때 행과 열 값을 변수로 선언하잖아요, def draw_fruits(arr, ratio=1): # arr : 출력할 이미지의 배열 n = len(arr) # n은 샘플 개수이다. / 출력할 이미지의 개수를 담을 변수 # 한 줄에 10개씩 이미지를 그린다. 샘플 개수를 10으로 나누어 전체 행 개수를 계산한다. rows = int(np.ceil(n/10)) # 10개의 열을 둔다. ceil() --> 올림 함수 # 행이 1개 이면 열 개수는 샘플 개수이다. 그렇지 않으면 10개이다. cols = n if rows < 2 else 10 <-- fig, axs = plt.subplots(rows, cols, figsize=(cols*ratio, rows*ratio), squeeze=False) for i in range(rows): for j in range(cols): if i*10 + j < n: # n 개까지만 그린다. axs[i, j].imshow(arr[i*10 + j], cmap='gray_r') axs[i, j].axis('off') plt.show() 1. raws에 저장된 값이 행의 개수이고 사과 이미지의 샘플 수가 100개라면 10개의 행이 저장되는 건데, cols 변수의 조건문에서 어떻게 '행이 1개라면'이라는 가정을 하나요? 행이 한개만 나올 수가 없지 않나요? 행이 1개일 때 열 개수가 샘플 개수이고 그렇지 않으면 10개라는 말이 잘 이해되지 않습니다.
- 미해결혼자 공부하는 머신러닝+딥러닝
평균과 가까운 사진 고르기
279p에서 평균과 가까운 이미지를 고를 때, axis=1,2 값으로 지정하는 이유가 첫 번째 차원인 300개의 샘플을 평균을 내면 안 되어서인데 구체적인 이유가 궁금합니다.
- 미해결혼자 공부하는 머신러닝+딥러닝
분류 vs 회귀
분류 모델에서 정확도는 미분이 안되어 손실 함수로 쓸 수 없기 때문에 손실 함수는 회귀 모델에서 주로 쓰이고 분류 모델에서 정확도를 평가하기 위해서는 정확도 대신 로지스틱 손실 함수를 사용한다고 하셨는데, 분류 모델을 정확도로 평가하지 않고 굳이 로지스틱 손실 함수를 사용하여 z값을 바꿔 확률값을 측정하는 이유가 뭔가요?! 경사하강법을 통해 더욱 정확한 값을 예측하기 위해서인 건가요?
- 미해결혼자 공부하는 머신러닝+딥러닝
경사하강법
확률적/미니배치/배치 경사하강법 각각의 계수가 모두 하이퍼 파라미터값인가요?
- 미해결혼자 공부하는 머신러닝+딥러닝
로지스틱 회귀 (다중 분류)
코드를 분명 똑같이 작성하고 오타도 여러 번 확인한 데다 처음부터 끝까지 코드를 다시 실행해 보기도 했으나, 소프트맥스 함수 사용 이전의 확률값과 사용 이후의 확률값이 다르게 나옵니다... 전 ) [[0.998 0.001 0. 0. 0. 0. 0.002] [0. 0. 0.001 0.999 0. 0. 0. ] [0. 0.002 0.051 0. 0.006 0.941 0. ] [0. 0.001 0.86 0.001 0.135 0. 0.004] [0.009 0.783 0.007 0. 0.187 0. 0.014]] 후) [[0. 0.014 0.841 0. 0.136 0.007 0.003] [0. 0.003 0.044 0. 0.007 0.946 0. ] [0. 0. 0.034 0.935 0.015 0.016 0. ] [0.011 0.034 0.306 0.007 0.567 0. 0.076] [0. 0. 0.904 0.002 0.089 0.002 0.001]] 이외의 모든 출력값은 강의와 동일합니다. 왜 그런 걸까요?ㅜㅜ + predict_proba 함수로 출력되는 값 중에서 행, 즉 샘플들은 무엇을 의미하나요? 클래스가 7개의 생선 종류를 의미하는 건 알고 있습니다. 이전 강의에서 행은 샘플, 열은 샘플의 각 특성으로 구분된다고 하셔서, 행을 구하려는 종류, 열을 물고기의 크기나 무게라고 생각했는데 이와 반대인가요?
- 미해결혼자 공부하는 머신러닝+딥러닝
polynomialFeatures 질문
훈련세트에만 poly.fit을 적용한 이유가 궁금합니다. 강의에서 설명해 주셨는데 잘 이해가 잘 되지 않습니다.
- 미해결혼자 공부하는 머신러닝+딥러닝
그래프 그릴 때 선
마지막에 k값을 3, 1, 42일 때로 그래프를 세 종류로 나눠 그리셨는데, 그 선이 의미하는 바와 그래프 그린 코드 좀 알 수 있을까요!?ㅜㅜ
- 미해결혼자 공부하는 머신러닝+딥러닝
질문이 있습니다!
선생님 덕분에 쉽고 빠르게 머신러닝에 대해서 이해할 수 있었고, 재미있게 공부중인 학생입니다. 금일 강의에서는 모델 구성에 대해서 배웠는데, 궁금한점이 조금 있습니다. 이 하이퍼 파라미터라는게 단순히 커널의 크기, 풀링의 크기등 뿐만 아니라 레이어도 하이퍼 파라미터가 될 수 있는건가요? 그리고 오늘 말씀하신 부분에서는 하이퍼파라미터는 여기저기 시도해보고 만들어봐야한다고 하시는데, 다른 최적화 방법은 따로 없는건가요? 기초적인 질문이라, 부끄럽습니다만, 소중한 답변 달아주시면 또 다음강의 기쁜 마음으로 열심히 들을 수 있을 것 같습니다. 감사합니다.
- 미해결혼자 공부하는 머신러닝+딥러닝
features
수업 잘 듣고 있습니다, 선생님. 다른 예제들을 풀다보면 wine[['alcohol', 'sugar', 'pH']].to_numpy() 처럼 feature가 3개인 경우는 크게 문제가 되지 않는데 feature가 10개가 넘어가는 경우에는 위 코드처럼 일일이 치는데 제한이 됩니다. 혹시 일일이 치지 않고 csv파일에서 features를 바로 input으로 넣는 코드가 있나요?
- 미해결혼자 공부하는 머신러닝+딥러닝
딥러닝 공부
딥러닝 관련해서 공부하다가 개념적으로 헷갈리는 부분이 있어서 책을 구입하게 됐습니다. 그런데, 제가 배운 내용들은 CNN이나 RCNN, SDD와 같은 네트워크들인데, 이 책엔 그에 관한 내용이 없는 것 같아서 혹시 이 책에 나온 딥러닝의 내용들과 cnn, rcnn,과 같은 알고리즘을 어떻게 연결해서 보면 좋을지 질문 드립니다.
- 미해결혼자 공부하는 머신러닝+딥러닝
특성공학과 규제 강의 중 질문
강의 도중 이해가 안되는 부분이 있어 질문드립니다. 1. poly.fit([[2,3]])은 기본적으로 [1, a, b, a^2, ab, b^2]의 꼴을 가지게 되는데 이 형태가 갖는 의미가 무엇이며 왜 이 형태를 불러와야하는지 모르겠습니다 2. poly.get_feature_names() ['x0', 'x1','x2', 'x0^2', 'x0 x1', 'x0 x2', 'x1^2', 'x1 x2', 'x2^2'] 각각의 이름들이 해당하는 의미가 무엇이며 이 코드의 필요성은 무엇인가요 수업 잘 듣고 있습니다.
- 미해결혼자 공부하는 머신러닝+딥러닝
로지스틱의 매개변수에 대해 질문이 있습니다.
안녕하세요. 혼공머신 수업 잘 듣고 있습니다. 좋은 강의 해주셔서 감사합니다. 혼공머신 책의 마무리 파트를 읽다가 궁금한 점이 생겼습니다. LogisticRegression의 경우, penalty라는 매개변수에서 l2가 default이며, 이는 릿지 방식을 의미한다고 나와 있습니다. 앞선 chapter의 LinearRegression에서는 릿지와 라쏘가 따로 존재했었는데요, 그렇다면, 로지스틱은 반드시 릿지와 라쏘 둘 중 한가지 방식을 선택해야 하는 것이고 선형은 그렇지 않아도 된다는 뜻인데, 왜 그렇게 되었는지 궁금합니다. 간단하게 정리드리자면 선형에는 '기본', '릿지', '라쏘' 3가지가 존재하는 반면, 로지스틱에는 '릿지(Default)', '라쏘' 2가지만 존재하는 것으로 이해됩니다. 제가 이해한 것이 맞는지? 맞다면 왜 그렇게 만들어졌는지 여쭤보고 싶습니다.
- 미해결혼자 공부하는 머신러닝+딥러닝
사이킷런 input 2차원배열 관련 질문
안녕하세요. 좋은 강의 해주셔서 감사합니다. sklearn에 들어가는 자료의 배열에 대해 질문이 있습니다. 강의를 보면 train_input은 reshape을 해주는 반면, train_target은 reshape을 해주지 않습니다. 사이킷런에서는 Input으로 들어가는 데이터에 대해서만 2차원 배열을 요구하나요? 그렇다면, target 데이터는 1차원이든 2차원이든 상관이 없나요?
- 미해결혼자 공부하는 머신러닝+딥러닝
프로그램 소스코드
소스코드는 어디있나요? 뭔가 실행이 안되는데...