묻고 답해요
158만명의 커뮤니티!! 함께 토론해봐요.
인프런 TOP Writers
-
해결됨[개정판] 파이썬 머신러닝 완벽 가이드
너무 궁금해서 문의드려봅니다.
안녕하세요. 책도보고 동영상도 보고 있는데 너무 궁금해서 이렇게 강의와 직접적인 관련이 없는데도 불구하고 이런 경우는 어떻게 접근해야할지 몰라서 문의드려봅니다. 문장의 예) Gildong weighs 60kg. Cheolsu weighs 70kg. Younghee weighs 49kg. 위 문장 텍스트에서 영희라는 사람의 몸무게를 구하고 싶습니다. 기존 개발방법이라면 문장으로 배열화 시켜서 for문 돌리면서 if문 사용하여 Younghee, weighs 단어가 포함된 문장배열에서 kg이 포함된 단어 또는 정규식으로 사용하든지해서 구할것입니다. 그러나 이렇게 나온 데이터가 AI영역에서는 의미가 없어 보입니다. 비정형화된 텍스트에서 특정 원하는 값을 구하고싶은데 AI 머신러닝 딥러닝의 개념으로 처리를 한다면 어떻게 접근해야할지 너무 감이 안옵니다. 정말 그냥 for문, if문 사용해서 영희의 몸무게를 뽑아내야하는건지 AI 개념에서는 어떻게 접근해야할지 작은 조언이라도 부탁드립니다.
-
미해결[개정판] 파이썬 머신러닝 완벽 가이드
공부방법 관련
안녕하세요 강의 잘듣고 있습니다. 머신러닝에 대한 개념이 많이 부족한지라 생각보다 시간이 걸리네요. 공부방법에 관한 질문드립니다. 혹시 코드를 하나하나 다 따라해보며 한줄한줄 다 이해하는게 나을까요 (현재 이런 방식으로 하고있습니다) 아니면 코드의 흐름 및 알고리즘 개념만 이해했으면 넘어가는게 나을까요?
-
미해결[개정판] 파이썬 머신러닝 완벽 가이드
GridSearchCV 질문드립니다
grid 에서 나온 최적의 하이퍼 파라미터 값이 직접 y_test 히여 정확도를 추출하였을때의 성능 모델 순위에서 낮으면 어떻게 하나요 ? 예를들어서 max_depth = 8로 최적 파라미터값이 출력이 되었는데 y_test 를 가지고 돌렸을시 max_dept =12 인 정확도가 가장 높을때 어떻게 하나요 ?
-
미해결[개정판] 파이썬 머신러닝 완벽 가이드
임곗값 배열에 대한 질문입니다.
강의 약 9분 44초즈음에 보면 변환된 분류 결정 임곗값 배열의 Shape는 147이고 나머지는 148의 값을 갖습니다. 저의 경우, sklearn 0.23.1 버전으로 돌리고 있으며, 임곗값= 143, 나머진 각각 144로 1개씩 더 많습니다. 보면 (버전의 다름과 상관없이) 임계값의 배열수보다 1씩 더 많은 결과가 발생하는데요, 임계값이 정밀도, 재현율에 비하여 1개씩 부족한 이유에 대하여 알 수 있을까요?
-
미해결[개정판] 파이썬 머신러닝 완벽 가이드
강의 slide 공유
강의 slide를 보며 공부하려는데 공유받을 수 있는지 질문드립니다
-
미해결[개정판] 파이썬 머신러닝 완벽 가이드
cross val score, gridsearchCV 차이
1. grid가 교차검증과 하이퍼파라미터 튜닝을 동시에 해주는 것이면 cross val score를 또 수행할 필요는 없는것인가요? 또 수행하면 교차검증을 2번하는것으로 이해가 됩니다... 2. 사이킷런 train test split을 적용한 뒤에 또 cross나 grid를 수행하면 데이터를 3가지로 다시 나누는 것인가요? 이런 경우라면 굳이 split을 사용하지 않고 cross나 grid로 처음부터 데이터를 나누면 되지 않나...그런 혼돈이 옵니다...
-
미해결[개정판] 파이썬 머신러닝 완벽 가이드
cross_val_score와 GridSearchCV의 차이점이 무엇인가요?
안녕하세요. 현재 선생님의 머신러닝 강의를 수강하고 있는 학생입니다 Section2의 교차검증 성능평가라는 강의를 듣다 궁금한 점이 있어 질문을 올립니다 1. 강의중 하이퍼 파라미터라는 말씀을 하시는데 혹시 하이퍼파라미터라는게 '함수의 계수'라고 생각하면 될까요? 혹시 하이퍼파라미터와 일반적으로 사용하는 파라미터와의 차이점이 있을까요? 2. cross_val_score 메소드와 GridSearchCV메소드의 사용점의 대한 명확한 차이가 궁금합니다. 제가 강의를 듣어 어림잡아 이해한것은 cross_val_score는 메소드 내에서 임의로 파라미터를 설정해 모델을 평가하는 방법이고, GridSearchCV의 경우 사용자가 사용하고 싶은 파라미터 리스트가 존재한다면 해당 리스트 중에서 가장 적합한 파라미터를 추출하는 방법이라고 이해했습니다. 그럼 제가 이해한것이 맞다면, 사용자가 파라미터 리스트가 존재하지 않는다면 cross_val_score 메소드를 사용하는 것이 맞는지요? 1번과 2번의 대한 질문의 답변 부탁드리겠습니다 소중한 강의 정말 감사합니다
-
해결됨[개정판] 파이썬 머신러닝 완벽 가이드
함수의 원형
안녕하세요. 판다스(Pandas) 개요와 기본 API - 01 편에서 9분24초에 나오는 부분에 대한 질문입니다. 영상에서 함수의 원형이라고 말씀 하시면서 함수에 쓸수 있는 옵션을 전부 보여 주셨는데요. 어떻게 하면 그렇게 함수의 쓸 수 있는 옵션을 볼 수 있는지 궁금 합니다. 그리고 그것을 볼 수 있는 단축키 같은 것도 존재 한다면 알려 주세요. 감사합니다.
-
해결됨[개정판] 파이썬 머신러닝 완벽 가이드
머신러닝 속도 높이는 방법
안녕하세요? 저는 이제 막 머신러닝에 관심을 갖고 공부를 시작했습니다. 한 가지 궁금한 점은 저의 경우 100만개 정도 데이터로 머신러닝을 수행하는 경우도 있을 것으로 예상하는 데 머신러닝 속도를 높이는 방법이 궁금합니다. 배워도 속도 때문에 활용도가 낮아질까 염려되어 미리 질문 드립니다. 좋은 강의 감사합니다.
-
미해결[개정판] 파이썬 머신러닝 완벽 가이드
모형에 대한 타당도
선생님 안녕하세요! 강의 잘 듣고 있습니. 선생님께서 roc곡선 같은경우는 회귀보다는 0이냐 1이냐와 같이 분류를 하는 예측모형에서 모형의 타당도를 확인할때 많이 이용된다라고 하셨던 것 같습니다. 그렇다면 이전에 붓꽃을 분류하는 데이터와 같이 결과값이 3종류로 나눠지는 경우는 다른 값을 사용해야하나요? 1,0,2 와 같이 결과값을 구분하였을 때는 강의에서 나온 것 처럼 정밀도 재현율, roc 곡선 같은 것들을 그대로 사용해도 되는 건가요? .
-
미해결[개정판] 파이썬 머신러닝 완벽 가이드
feature importance
DT에서 feature importance는 어떻게 결정되는지요? 강의에서는 importance를 확인하는 방법을 배웠는데, 이것이 어떻게 얻어진것인지 궁금합니다.