YoungJea Oh님의 게시글 - 인프런

YoungJea Oh

@trimurti

수강생

4,276

수강평

381

강의 평점

4.7

게시글

질문&답변
Colab실습관련
입문과정에서 Colab 을 사용한다면 아마도 딥러닝 모델에서 무료 GPU 사용을 위해서일겁니다. 그냥 local PC 의 jupyter notebook 환경에서 작업하시면 됩니다. pip install tensorflow 로 텐서플로우 설치하시고 GPU 대신 CPU 에서 작업하시면 작업 시간이 조금 더 걸릴뿐 공부하시는데 지장은 없습니다. 감사합니다.
0
2
26
질문&답변
트랜스포머 FeedForward 관련 질문
1) FeedForward 의 의미가 무엇인지요 ?FFN(x)=max(0,xW1+b1)W2+b2 이므로 비선형 함수 ReLU 를 통과시켜 비선형 특성을 학습하여 표현력을 증가시키는 목적입니다.2) 단순 Dense 레이어라면 loss 함수가 있어야 특정 목적의 학습이 이루어질것 같은데 단순 통과만 시킨다면 어떤 결과가 달라지는지요?loss 함수는 Transformer Decoder 블록의 제일 상단에 softmax 함수가 있으므로 CrossEntropy Loss 로 Transformer Encoder-Decoder 전체 출력의 손실을 계산합니다. 따라서 FFN 은 Encoder 와 Decoder 블록 내에 위치하는 중간 layer 이므로 별도의 loss 함수가 있을 필요 없습니다.Attention Layer 가 단어 간 상관 관계를 학습하여 문맥 정보가 섞인 표현을 만든다면, FFN 은 각 토큰에 대해 비선형 변환을 적용하여 그 문맥 정보를 해석하고 표현력을 확장하는 역할을 합니다.
0
2
27
질문&답변
흑백 이미지 resnet 전이학습 분류 질문 있어요
첫번째 방법을 추천합니다. 이유는, 가중치를 구조 변경 없이 그대로 활용할 수 있어 전이학습의 안정성과 재현성이 가장 높기 때문입니다. 좋은 질문 감사합니다.
0
2
30
질문&답변
get_dummies 관련문의
(질문 1) 만약에 새로운 위에 있는 데이터를 predict 하고 싶으면, df에 concat 시키고, 다시 get_dummies 후에 해당 Row로 predict 해봐야 되는건가요?--> 새로운 data 는 학습에 사용되었던 df 와 섞이면 안되고 새로운 data 만으로 학습 데이터에서 만들어진 column 과 동일한 column 구조로 맞춰줘야 합니다. 새로운 data 한 건이 발생했다면 get_dummies 는 다음과 같이 코딩하면 됩니다.# 학습 시 사용했던 원-핫 컬럼dummy_cols = ['Embarked_C', 'Embarked_Q', 'Embarked_S']import pandas as pdnew = pd.DataFrame({'Embarked': ['Q']})encoded = pd.get_dummies(new, columns=['Embarked'])encoded = encoded.reindex(columns=dummy_cols, fill_value=0)print(encoded) Embarked_C Embarked_Q Embarked_S 0 1 0(질문 2)그리고 만약에 embarked에 Z라는 새로운 카테고리가 생기면 다시 학습시켜줘야 되는건가요?--> 학습 때 없던 Z는 자동으로 모든 열을 0으로 처리합니다:Embarked_C = 0Embarked_Q = 0Embarked_S = 0따라서, 다시 학습 시킬 필요 없습니다. 단, Z 라는 카테고리가 의미있는 정보이고 많이 발생하는 경우라면 학습 데이터에서 누락된 것이므로 Z 카테고리를 포함해서 다시 학습시켜야 합니다.
0
2
36
질문&답변
강의 수강
안녕하세요. 저도 이런 질문을 처음 받아보아서 인프런의 AI 에게 질의한 결과 다음과 같은 회신을 받았습니다.현재 인프런에서는 미리보기로 수강한 이력은 결제 이후의 수강 진도에 포함되지 않고, 결제 후 다시 수강해 주셔야 진도율과 완료 여부, 그리고 AI퀴즈 이용이 가능해요.완료 표시 및 AI퀴즈 이용을 위해서는 아래를 확인해 주세요.- 강의실 오른쪽의 "커리큘럼" 또는 "강의 대시보드"에서 강의별 체크 표시를 확인해 주세요.- 체크가 안 되어 있는 유닛(영상)은 다시 끝까지 재생해 수강을 완료해 주세요.- 수강을 완료했는데도 완료 처리되지 않았다면, 각 강의 하단의 [v봤어요] 버튼을 눌러 수동으로 완료 처리해 주세요.위 방법으로도 해결되지 않을 경우에는, 강의실 내에서 재생이 끝났는지와 [v봤어요] 버튼 클릭 여부를 한 번 더 확인해 주시면 좋겠습니다.
0
1
40
질문&답변
실습 강의 화질이 너무 안좋아요
제가 기술적으로 미숙해서 녹화 화질을 놓쳐 불편을 드려 죄송합니다. 장기적으로는 실습 부분을 재녹화할 계획을 가지고 있으나 양이 많아 고민중 입니다. 불편에 대한 사과의 표시로 제 다른 강의 중 듣고 싶으신 과정 하나 알려주시면 무료 쿠폰 발행해 드리겠습니다. 불편에 다시 한번 사과 드립니다.
0
1
48
질문&답변
파라미터갯수에대한질문(030_IMDB_movie_reviews)
Embedding(vocab_size + 1, 64) → 10,001×64=640,064Bidirectional(LSTM(64)) LSTM 한 방향의 파라미터 공식 : 4 × (d·u + u·u + u) = 4 × u × (d + u + 1) u = 64 (LSTM 유닛 수), d = 64 (임베딩 출력 차원) 4×64×(64+64+1)=4×64×129=33,024Bidirectional 이므로 2배: 33,024×2=66,048Dense(64, activation='relu')바이디렉셔널 LSTM 출력(128) × 64(출력) + bias 64(뉴런마다 1개) = 128×64+64=8,256Dense(1, activation='sigmoid')64(입력) × 1(출력) + bias 1 = 65좋은 질문 감사합니다.
0
1
35
질문&답변
객체 인식에 대한 질문이 있습니다.
컴퓨터 비전에서는 ‘색상만으로’ 분류하려 하면 여러 변수들이 개입합니다.예를 들어 조명, 반사, 카메라 화이트밸런스, 용기 형태로 인한 빛 왜곡등 때문에, ‘흑갈색 vs 갈색’처럼 미묘한 색상 차이를 RGB 값만으로 안정적으로 구분하기는 거의 불가능합니다.그래서 99% 정확도를 단순 색상으로 달성하는 것은 어렵습니다. 좋은 질문 감사합니다.
0
1
32
질문&답변
섹션 10 비지도 학습에 대하여
지도학습 문제를 그대로 비지도학습으로 바꾸면 ‘정답이 없는 문제’가 되어버려, 정확한 분류나 예측은 어려워집니다. 하지만 같은 데이터로 다른 목적의 모델 작성, 예를 들어 유사한 패턴끼리 클러스터링 같은 것은 가능합니다. 따라서 목적이 바뀌면 동일한 데이터를 두가지 용도로 모두 사용할 수 있습니다. 좋은 질문 감사합니다.
0
1
41
질문&답변
16:07슬라이드에소 헷갈리는 부분이 있습니다
두 network 의 차이점을 추가로 설명 드리겠습니다.b 의 역할 - 에이전트가 환경에서 경험을 수집할 때 따르는 정책. 대표적인 예가 e-greedy 정책입니다.- 다양한 경험을 위해 epsilon 만큼 무작위 행동을 합니다. 만약 잘못된 선택이었으면 weight 를 잘못된 방향으로 업데이트 하게 되겠지만 잘된 선택이었으면 weight 업데이트가 올바른 방향으로 진행되게 합니다.오프폴리시 학습에 사용합니다. 2. Q 의 역할 - 네트워크 자체의 출력입니다. 현재 네트워크가 출력하는 정책이 좋은 정책이면 점점 그 방향으로 weight를 이동시킵니다. 좋은 질문 감사합니다.
0
2
40