수강이 제한됩니다.
다른 수강생들이 자주 물어보는 질문이 궁금하신가요?
- 미해결밑바닥 부터 시작하는 머신러닝 입문
소스코드
위 강좌의 소스코드는 어디서 볼수 있는건가요?
- 미해결밑바닥 부터 시작하는 머신러닝 입문
질문있습니다
질문1. 해당 강의의 2분 근처에서, raw_X는 2차원으로, y는 1차원으로 만드는 이유가 뭔가요? 질문2. 1차원이 vector인가요..? 질문3. (1, )과 (1, 1)의 차이가 뭔지도 알려주세요 ㅠㅠ
- 미해결밑바닥 부터 시작하는 머신러닝 입문
deactivate 가 되지 않는 경우
안녕하세요. "source deactive"를 사용하여 conda 가상환경 해제 시 파일 또는 디렉터리가 없다는 문구가 나옵니다. 이와관련하여 Github: #458: "Using source deactivate on a conda env fails unless the root anaconda directory is in PATH". 이런 문제가 있다는 걸 찾았는데 잘 이해가 되지 않아 질문을 드리게 되었습니다. 확인 부탁 드립니다! 감사합니다.
- 미해결밑바닥 부터 시작하는 머신러닝 입문
kaggle_titanic_pclass one-hot encoding에 대해 질문드립니다.
안녕하세요, 강의 잘 들었습니다. 현재는 필요한 부분을 다시 들으며 복습하고 있습니다. 강의 중 kaggle의 titanic 문제에 대해 다루는 부분에 대해 질문드립니다. embarked의 경우엔 텍스트로 된 범주형 자료이기에 one-hot encoding으로 분류해주는 것으로 이해했습니다. 하지만 강의에서는 pclass의 경우 구분해주지 않고 숫자 그대로 사용하고 있습니다. 하지만 엄밀한 의미에서 pclass도 숫자이긴 하지만 fare와 같은 연속형 자료가 아닌 범주형 자료이기 때문에 one-hot encoding으로 분류를 해주어야 하지 않은지 문의드립니다. 만약 하지 않아도 괜찮다면, embarked도 01,2,3,으로 나누어서 작업해도 되지 않은지도 궁금합니다. +혹시 pclass가 범주형 자료이지만 계급이라는 특성상 하이에라키가 있어서 연속형의 성질을 가지고 있어서 one-hot encoding을 하지 않다고 되는 것인지도 문의드립니다. 감사합니다.
- 해결됨밑바닥 부터 시작하는 머신러닝 입문
소스 위치는?
강의자료는 받았는데, 소스 파일 다운로드 경로를 못찾겠네요. 답변 부탁드립니다.
- 미해결밑바닥 부터 시작하는 머신러닝 입문
Data fill
안녕하세요, df['PostTestScore'].fillna(df.groupby('sex')['PostTestScore'].transform('mean'), inplace=True) 에서 성별로 나눠서 평균 값을 집어 넣으라고 하셨는데, 예를들어 성별인 남자인 학생들의 전체평균을 PostTestScore이 null 인남학생 값에 넣어주는 것인가요? 마찬가지로, 성별이 여자인 사람들의 평균점수를 null 을 가진 여자 사람의 점수값에 집어 넣는거고요? 감사합니다.
- 미해결밑바닥 부터 시작하는 머신러닝 입문
thresh 질문
안녕하세요, 수업을 들으면서 df.dropna(axis=1, thresh=3) 이 화면엔 data가 최소 4개이상 없을때 drop 하라고 하셨는데, 말씀하실땐, 3개 까지는 드랍을 하고 4개부터는 드랍을 하지 마라고 하셨고, 코드 설명하실때도 적어도 3개이상 데이터가 존재해야지만 날리지 말아라. 리고 하셨는데, 너무 헷갈립니다. thresh =3 일때 5일때 무슨 뜻인지 다시한번 설명 부탁드립니다. 감사합니다.
- 미해결밑바닥 부터 시작하는 머신러닝 입문
챕터6: 그래프 해석 질문
안녕하세요, plt.grid(True, lw=.4, ls='--',c='.90') 에서 True 가 그리드를 그리라는 의미인가요? lw 와 ls , c 각각의 의미도 궁금합니다. 또 figure를 저장할때, plt.savefig('test.png', c='a') 를 쓴다고 하셨는데, c='a' 가 여기서 무엇을 의미하는지도 알고 싶습니다. 감사합니다.
- 미해결밑바닥 부터 시작하는 머신러닝 입문
group by max 결과 질문 입니다.
안녕하세요, df.groupby('Team').filter(lambda x:x['points'].max()>800)에서 결과를 실행하면 왜 포인트가 800인 넘은 팀 이름들이 나오나요? 감사합니다.
- 미해결밑바닥 부터 시작하는 머신러닝 입문
챕터5: group by
안녕하세요, transformation 부분이 이해가 안됩니다. 설명해주신 예제를 보면 score=lambda x: (x.max()) grouped.transform(score) 인데 Riders 가 왜 876이 되고 랭크는 2가되며 year 은 2017년으로 변환 되나요? max 나 min 처럼 series data 에 적용되는 data들은 key 값을 기준으로 Grouped 된 데이터 기준 이라고 하셨는데, 무슨 의미 인가요? 또한 key값을 기준으로 한다면 Riders 가 Key 값인지도 궁금합니다. 자세한 설명 부탁드립니다. 감사합니다.
- 미해결밑바닥 부터 시작하는 머신러닝 입문
수업 내용 질문 문의
안녕하세요, 4단원 마지막 강의중 df.isnull().sum(0) 와 df.isnull().sum(1)때의 차이가 이해가 안됩니다. 다시한번 설명 부탁드립니다. 또한 df.sort_values(['age','earn'],ascending=False).head(10)에서 어떻게 age 에만 내림차순이 적용되는지도 궁금합니다. 왜 earn 항목엔 적용이 안되고 자동으로 age 만 적용이 되는건가요? 감사합니다.
- 미해결밑바닥 부터 시작하는 머신러닝 입문
문제가 이해가 안되는데요
frequent_matrix에서 source는 row로 정렬된다고 했는데 그러면 데이터에서 5번째를 보면 source가 1이고 target이 1이니까 마지막으로 출력했을때 1이 가장먼저 나와야하는거 아닌가요? 왜 19부터 나오는건지 모르겠습니다. 답으로 출력되는 첫번째 array에서 19, 17, 14...가 무슨 연관이 있는건가요?
- 미해결밑바닥 부터 시작하는 머신러닝 입문
B 가 Boolean 의 약자인가요?
안녕하세요, 챕터 3 강의중 Boolean index 에서 A=np.array([.........]) B=A<15 B.astype(np.int) 예제를 입력했는데, 자꾸 에러가 뜹니다. The result says "Type Error: '<' not supported ebtween instance of 'list' and 'int'. B 가 Boolean 입니까? 감사합니다.
- 미해결밑바닥 부터 시작하는 머신러닝 입문
normalize_ndarray
normalize_ndarray는 답은 다 맞는데 소수점에서 약간 틀리면 틀린걸로 간주하나요? set_printoption 에서 float_kind 옵션까지 바꿔줬는데 ( lambda x: "{0:0.8f}".format(x) ) 그래도 틀렸다고 하네요.. 이것때문에 시간을 많이 버렸는데 ㅠ
- 미해결밑바닥 부터 시작하는 머신러닝 입문
자막이 잘못되어있어요
이 다음 강의의 자막으로 적용되어있네요. 수정해주세요~
- 미해결밑바닥 부터 시작하는 머신러닝 입문
과제 제출시 다음과 같은 에러가 뜹니다...
과제 제출시 다음과 같은 에러가 뜹니다... ai.backend.client.exceptions.BackendClientError: BackendClientError('Request to the API endpoint has failed.\nCheck your network connection and/or the server status.\n➜ ClientConnectorCertificateError()') 어떻게 해결을 해야하나요??
- 미해결밑바닥 부터 시작하는 머신러닝 입문
test_n_size_ndarray_creation 문제에 대해 질문드립니다.
n이 주어짐에 따라 행렬을 만드는 문제인데 계속 통과하지 못해서 질문드립니다. returns의 설명이 행렬의 모든 원소를 할당시키는 것인지 0,0과 n-1,n-1만 할당시키는 것인지 잘 모르겠습니다. 다음은 제가 작성한 코드입니다. def n_size_ndarray_creation(n, dtype=np.int): X = np.zeros((n,n),dtype=dtype) count=0 for i in range(n): for j in range(n): X[i][j]=count count+=1 return X
- 미해결밑바닥 부터 시작하는 머신러닝 입문
과제 제출에 관해서 질문이 있습니다.
과제를 풀고 나서 제출을 하는 과정에서 ✘ BackendAPIError: 500 Internal Server Error Internal server error. 다음과 같은 에러로 제출이 되지 않는 것 같은데 어떻게 해결 해야 할지 알고 싶습니다.
- 미해결밑바닥 부터 시작하는 머신러닝 입문
sampling method 강좌 중에서
from sklearn.model_selection import train_test_split X_train_dataset, X_test, y_train_dataset, y_test = train_test_split( X_scaled,y, test_size=0.2, random_state=42) sgd_regressor = SGDRegressor( eta0=eta0, max_iter=max_iter, warm_start=True, learning_rate="constant") rmse_val_score = [] rmse_train_score = [] model_list = [] X_train, X_val, y_train, y_val = train_test_split( X_train_dataset,y_train_dataset, test_size=0.2, random_state=42) sgd_regressor.fit(X_train,y_train) for i in range(300): y_pred = sgd_regressor.predict(X_train) y_true = y_train rmse_train_score.append(rmse(y_pred, y_true)) y_pred = sgd_regressor.predict(X_val) y_true = y_val rmse_val_score.append(rmse(y_pred, y_true)) model_list.append(sgd_regressor) coef = sgd_regressor.coef_.copy() intercept = sgd_regressor.intercept_.copy() sgd_regressor = SGDRegressor( eta0=eta0, max_iter=max_iter, warm_start=True, learning_rate="constant") sgd_regressor.fit(X_train,y_train, coef_init=coef, intercept_init=intercept) 이런식으로 코드를 작성했는데 강의 내용과 그래프가 일치 하지 않습니다. 이미지파일로 올릴라고해도 올려지지가 않네요
- 미해결밑바닥 부터 시작하는 머신러닝 입문
예제코드
예제코드가 왜 없나요? 글씨가 작아 오타도 많고 예제코드를 주셔야 될 것 같습니다. 그리고 올려주신 강의자료 중간 부분에 625 페이지부터 파일의 어떤 오류로 인쇄가 되지 않습니다. 확인부탁드려요