묻고 답해요
164만명의 커뮤니티!! 함께 토론해봐요.
인프런 TOP Writers
-
미해결모두를 위한 대규모 언어 모델 LLM(Large Language Model) Part 1 - Llama 2 Fine-Tuning 해보기
Lora 기법 질문
Lora 기법으로 인해서 전체 모델의 56%의 파라미터만 fine tuning에 사용됐다고 하는데, 로직 내에서 fine tuning하겠다고 결정하는 기준이 있는건가요?
-
미해결파이썬을 활용한 머신러닝 딥러닝 입문
MAtplotlib 기초
OOP style 부분에서 자꾸 name 'fig' is not defined라고 오류가 나는데 어떻게 해결하나요..?
-
미해결실전도커: 도커로 나만의 딥러닝 클라우드 컴퓨터 만들기
Microsoft Remote Desktop -> Windows App 으로 변경
Mac App Store에서 Microsoft Remote Desktop이 Windows App으로 이름이 변경됐네요 한참 찾았습니다. 다른 분들 참고하시라고 남겨요!
-
미해결파이썬으로 시작하는 머신러닝+딥러닝(sklearn을 이용한 머신러닝부터 TensorFlow, Keras를 이용한 딥러닝 개발까지)
안내해주신 어떤 곳에도 보스턴 집값 예측 csv파일을 찾을 수 없습니다.
안내해주신 어떤 곳에도 보스턴 집값 예측 csv파일을 찾을 수 없습니다.
-
미해결모두를 위한 대규모 언어 모델 LLM(Large Language Model) Part 1 - Llama 2 Fine-Tuning 해보기
소스코드 다운받을 장소를 알려 주셔요.
강의에 사용된 소스코드는 어디에 있는지 문의드립니다.PDF파일은 있지만, 예제 풀이에 사용되는 colab에서 동작시키는 소스코드를 다운 받을 위치를 가르쳐 주셨으면 합니다.
-
해결됨딥러닝을 활용한 자연어 처리 (NLP) 과정 (기초부터 ChatGPT/생성 모델까지)
self-attention에서 Wq, Wk, Wv weight matrix 학습과정 질문드립니다.
self-attention에 등장하는 Wq, Wk, Wv weight matrix들에 대한 학습과정 질문입니다. attention score계산 시 query vector에 대해(예를들어 강의에서 설명하신 student vector) key vector들(am, a, student 벡터)의 attention score가 낮게 나온다면, 그게 loss가 되는건가요? 예를들어, Wq, Wk, Wv weight들이 충분히 학습되지 않았을 때를 생각해보면, "I" vector가 Query vector일 때, "student" key vector의 attention score가 가장 높게 나오지 않고 "am" key vector와 attention score가 가장 높게 나올 경우엔 loss가 발생하고 "student" key vector와의 score가 높게 나오도록 Wq, Wk, Wv가 업데이트 된다고 이해하면 될까요?(I와 student는 word embedding에 의해 유사성이 있다고 판단하고)
-
미해결[개정판] 파이썬 머신러닝 완벽 가이드
Softmax 관련 질문입니다.
안녕하세요. 선생님의 강의로 머신러닝 및 딥러닝에 관심을 갖게 되었습니다.다름이 아니고, CIFAR100 dataset에 대해서 VGGNet이라는 모델을 이용해 훈련을 시켜보고 있는데,제가 궁금한 것은 Softmax의 Input의 정밀도를 어디까지 유지하면 모델이 잘 학습될 수 있을까?입니다. 아래의 코드는 training부분입니다. 첫 번째 사진처럼 모델을 훈련시키는데, model(images)를 통해 나온 실제 output을 이용하면 모델이 잘 학습이 되는데 (마지막 epoch의 validation accuracy 55, Top-5 Test Accuracy 80%정도), 이 output을 rounding을 하면 소숫점 아래 20째자리까지 반올림을 해서 높은 정밀도를 유지해도 모델 학습이 아예 되지 않는 (모든 epoch가 끝나도 Validation Accuracy가 1%남짓) 문제가 발생합니다. 이러한 문제가 왜 발생하는지, 어떻게 하면 해결할 수 있을지또 제가 궁금한 Softmax layer에서 요구하는 최소 Input 정밀도에 대해 다른 방법으로 측정할 수 있을지 궁금합니다 ㅠㅠ감사합니다
-
해결됨딥러닝 이론 + PyTorch 실무 완전 정복
GoogleNet Inception 모듈
안녕하세요 선생님강의 잘 보고 있습니다구글넷의 인셉션 모듈 설명 중에 MAX pooling이 포함되어 있는데요보통 max pooling은 인풋의 사이즈를 줄이는 것으로 알고 있는데 그러면 다른 컨볼루션이 통과된 아웃풋과 사이즈가 달라져서 concat이 안되는 거 아닌가요?아니면 여기에 포함된 컨볼루션들은 max pooling과 같은 stride를 같는 걸까요?
-
해결됨딥러닝 CNN 완벽 가이드 - TFKeras 버전
강의 관련 질문입니다
안녕하세요 강사님 강의 잘듣고있습니다 fast api 강의 관련으로 질문드리고 싶어 질문남깁니다 현재 대학교 재학하면서 특정 기능을 수행하는 딥러닝 모델을 만든 후에 이를 배포해 웹에서 사용하는 프로젝트를 수행하려하는 중 강사님께서 fast api와 함께 웹 개발을 전체적으로 다루시는 강의를 출시한 것을 확인했습니다 제가 하려는 프로젝트의 방향과 fast api 강의의 내용이 부합할지 여쭙고 싶어 구매한 다른 강의에 실례를 무릅쓰고 이렇게 질문 드립니다 읽어주셔서 감사합니다
-
미해결[라즈베리파이] IoT 딥러닝 Computer Vision 실전 프로젝트
강의 자료 다운관련 문의 드립니다.
파이썬 텐서플로우 설치하기 영상을 보고 있는데 RBP_DL01_Raspberry pi install ? Edited (영상에 나와있는 해당문서) 해당 문서는 어디에 있나요? 강의자료 다운받은 곳에는 없는거 같습니다. 제가 받은 자료는 아래와 같습니다. 이거말고 다른곳에서 더 추가로 받아야 하나요?
-
해결됨딥러닝 이론 + PyTorch 실무 완전 정복
Batch Normalization 효과
안녕하세요 선생님강의 정말 잘 보고 있고요제 많은 질문들에도 너무 성심성의껏 답변 달아주셔서 감사합니다 ㅎㅎBatchNorm이 설계된 의도는 internal covariate shift를 해결하기 위해 제안되었다는 것은 이해했습니다.하지만 실제로는 그렇지 않고 optimization surface를 매끄럽게 해서 학습이 잘된다라고 설명하신 것까지 들었습니다.제가 이해한 바로는 활성화 함수에 들어가는 입력의 분포를 조정해서 학습이 잘되는 위치? 분포를 학습하는 것으로 이해했는데요(sigmoid로 예시를 든다면 더 이상 업데이트가 되지 않아도 될 정도라면 기울기가 saturate되는 부분으로 혹은 업데이트가 많이 되어야 한다면 0부근으로 이동시키는 등의) 정확히 어떤 원인에 의해 surface가 매끄러워지는 효과를 가지게 되는 것인지 궁금합니다..!
-
미해결실전도커: 도커로 나만의 딥러닝 클라우드 컴퓨터 만들기
Remote Tunnel 방식을 이용한 VSCode 환경 연결 중 문의
안녕하세요.강의 잘듣고 있습니다.Remote Tunnel 방식을 이용한 VSCode 환경 연결 강의를 수강하고 문의 내용이 생겨 질문드립니다. Connect를 누르고 connect to tunnel을 눌렀을때우리가 작업하고 있는 vm 이름이 바로 뜬것은 ssh로 접속을 했기 때문인가요?도커에서 환경이(강의에서는 폴더 이름이) 사용자 별로 분리가 된다고 하셨는데보통 같은 vm안에서 하나의 프로젝트를 함께 완성 시키는 경우라도 이렇게 분리해서 개발하나요?아니면 보통 이렇게 분리 되어 있는게 리소스는 하나를 공통으로 쓰고 각자 개발하는데에 유리한건가요?
-
미해결파이썬과 딥러닝을 활용한 시계열 자료 처리
자문자답 2 - 실습 (차분/이동평균)
실습 진행하실때yfinance 부분에서ms = yf.download("MSFT", start='2020-01-01', end='2021-12-31', progress=False) #Microsoft ms.drop(['High','Open','Low','Adj Close','Volume'], axis=1, inplace=True) ms['Yesterday_Close'] = ms['Close'].shift(1) ms.columns = [' '.join(col).strip() if isinstance(col, tuple) else col for col in ms.columns] ms.columns = [col.split()[0] for col in ms.columns] ms.reset_index(inplace=True) # 기존 인덱스 초기화 if 'Date' in ms.columns: ms.set_index('Date', inplace=True) ms['Price_Difference'] = ms['Close'].diff()이거 복붙하시면 진행되실거에요yfinance 버전업에서 ticker - 회사명 이 함께들어와서 오류가 생긴 것 같네요. 참고하셔요~
-
미해결파이썬과 딥러닝을 활용한 시계열 자료 처리
자문자답 - Pandas(groupby) 관련
실습 파트에 Groupby 함수가 적용이 안될 시group_variables = ['Order Date', 'Category'] desired = df.select_dtypes(['int16', 'int32', 'int64', 'float16', 'float32', 'float64']).columns grouped_df = df.groupby(group_variables)[desired].sum() grouped_df이렇게 숫자데이터만 잡아서 해보면 되실거에요
-
미해결AI 포트폴리오 만들기 - Airbnb 클론 프로젝트
강의자료 요청합니다.
강의자료가 없네요.head1ton@gmail.com 으로 요청합니다.
-
미해결실전도커: 도커로 나만의 딥러닝 클라우드 컴퓨터 만들기
RDP 셋업시 문제가 발생합니다.
az vm open-port --resource-group kaggle-linux-gpu_group --name kaggle-linux-gpu --port 3389Please run 'az login' to setup account. 상기와 같이 az login 을 하라고 하는데 인터넷에서도 해결법을 찾기가 쉽지 않네요. 도움 부탁드립니다
-
미해결최신 딥러닝 기술과 객체인식
강의자료
안녕하세요 수업 자료를 다운 받았는데, 혹시 강의 슬라이드가 없어서요 확인 가능하실까요?
-
해결됨딥러닝 이론 + PyTorch 실무 완전 정복
Layer Norm이 언어모델에 적합한 이유
안녕하세요 선생님강의 정말 잘 보고 있습니다.Layer Normalization을 보는 중에 입력 데이터를 Normalization하는 것을 통해 scale이나 shift에 robust하게 되는 것까진 이해했습니다.이런 효과가 왜 이미지보다 언어 모델에 더욱 효과적인지 이유를 알 수 있을까요?
-
미해결딥러닝 CNN 완벽 가이드 - TFKeras 버전
residual block과 identity block의 차이
- 학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요! - 먼저 유사한 질문이 있었는지 검색해보세요. - 강의 내용을 질문할 경우 몇분 몇초의 내용에 대한 것인지 반드시 기재 부탁드립니다. - 서로 예의를 지키며 존중하는 문화를 만들어가요. - 잠깐! 인프런 서비스 운영 관련 문의는 1:1 문의하기를 이용해주세요. 안녕하세요. 강의 정말 잘 듣고있습니다!resnet을 공부하던 중 궁금증이 들어서 그런데 residual block과 identity block은 같은 말인건가요??
-
해결됨실전도커: 도커로 나만의 딥러닝 클라우드 컴퓨터 만들기
Virtual Machine 생성시 가격문의
472.31/month 라는 가격이 한달 내내 해당 virtual machine을 사용한다고 가정했을때 과금 되는 가격이라고 이해하면 될까요?